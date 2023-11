Tha modal cànain fiosrachaidh fuadain ChatGPT air mòran aire a tharraing airson a chomas a dhol an sàs ann an còmhraidhean a tha gu math daonna. Ach, tha dithis luchd-rannsachaidh aig Oilthigh California, San Diego air co-dhùnadh ged a tha ChatGPT a ’tighinn faisg air a bhith a’ dol seachad air deuchainn Turing, nach eil e goirid mu dheireadh.

Ann an sgrùdadh leis an tiotal “A bheil GPT-4 a’ dol seachad air an Deuchainn Turing? ” foillsichte air an t-seirbheisiche ro-chlò-bhualaidh arXiv, rinn Cameron Jones agus Benjamin Bergen sgrùdadh air coileanadh ChatGPT ann a bhith a’ gineadh chòmhraidhean a dh’ fhaodadh com-pàirtichean a mhealladh gu bhith a’ smaoineachadh gu robh iad a’ bruidhinn ri duine. Rinn iad “geamannan” far an robh com-pàirtichean ag eadar-obrachadh le modal daonna no GPT agus chaidh iarraidh orra comharrachadh cò leis an robh iad a’ conaltradh.

Sheall na co-dhùnaidhean gun do shoirbhich le GPT-4 com-pàirtichean a shàrachadh 41% den ùine, agus choilean an dreach roimhe, GPT-3.5, ìre meallta de dìreach 5% gu 14%. Gu inntinneach, fhuair com-pàirtichean daonna air daoine eile a chreidsinn mun chinne-daonna aca ann an dìreach 63% de na deuchainnean.

Cho-dhùin Jones agus Bergen nach eil ChatGPT a’ dol seachad air deuchainn Turing, a’ nochdadh gu bheil crìochan aige fhathast ann a bhith a’ gineadh toradh nach gabh aithneachadh bho fhreagairtean daonna. Ach, chuir iad cuideam air iomchaidheachd leantainneach deuchainn Turing mar fhrèam airson measadh a dhèanamh air èifeachdas conaltradh innealan agus tuigse fhaighinn air ro-innleachdan daonna airson atharrachadh gu innealan AI.

Chomharraich an luchd-rannsachaidh cuideachd na buaidhean a dh’ fhaodadh a bhith aig modalan AI a bhith a ’dèanamh atharrais air daoine. Le ìre soirbheachaidh de 41%, dh’ fhaodadh droch bhuaidh sòisealta is eaconamach a bhith aig mealladh le modailean AI, gu sònraichte ann an co-theacsan far nach eil luchd-cleachdaidh cho mothachail gum faodadh iad a bhith ag eadar-obrachadh le inneal.

A bharrachd air an sin, chomharraich an sgrùdadh nithean air an do bheachdaich com-pàirtichean nuair a bha iad a’ dearbhadh an robh iad ag eadar-obrachadh le daoine no innealan. Bha dreuchdan cudromach aig foirmeileachd, neo-fhoirmealachd, briathrachas, gràmar, puingeachadh, agus freagairtean fuaimneach coitcheann ann a bhith a’ comharrachadh chòmhraidhean a chruthaich AI.

Mar a bhios modalan AI mar ChatGPT a’ leantainn air adhart a’ tighinn air adhart agus a’ fàs nas siùbhlach, chuir an luchd-rannsachaidh cuideam air an fheum air an leasachadh a leantainn agus ro-innleachdan a leasachadh gus mealladh a lasachadh.

Ceistean Bitheanta (Ceistean Cumanta)

Dè a th’ ann an deuchainn Turing?

Tha an deuchainn Turing, a tha air a mholadh leis an neach-matamataig Alan Turing, na thomhas de chomas inneal giùlan tuigseach a thaisbeanadh nach eil eadar-dhealaichte bho ghiùlan duine.

Ciamar a rinn an luchd-rannsachaidh measadh air coileanadh ChatGPT?

Rinn an luchd-rannsachaidh “geamannan” far an robh com-pàirtichean ag eadar-obrachadh le duine no ChatGPT agus bha aca ri faighinn a-mach cò ris a bha iad a’ bruidhinn.

Dè an ìre soirbheachais a choilean ChatGPT ann a bhith a’ mealladh chom-pàirtichean?

Shoirbhich le ChatGPT (GPT-4) com-pàirtichean a mhealladh 41% den ùine, agus choilean an dreach roimhe, GPT-3.5, ìre meallta de 5% gu 14%.

Dè a’ bhuaidh a dh’ fhaodadh a bhith aig modalan AI a bhith ag atharrais air daoine?

Ma tha modalan AI gu cinnteach a’ dèanamh atharrais air daoine, dh’ fhaodadh builean sòisealta is eaconamach farsaing a bhith aige, a dh’ fhaodadh a bhith a’ leantainn gu mealladh agus blur eadar-obrachadh daonna-inneal.

Dè na feartan air an do bheachdaich com-pàirtichean nuair a bha iad a’ comharrachadh chòmhraidhean a chruthaich AI?

Thug com-pàirtichean aire do nithean leithid foirmeileachd, neo-fhoirmealachd, briathrachas, gràmar, puingeachadh, agus freagairtean fuaimneach coitcheann gus faighinn a-mach an robh iad a’ conaltradh ri daoine no innealan.

(Tobar: arXiv)