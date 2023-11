Kunstig intelligens språkmodell ChatGPT har fått betydelig oppmerksomhet for sin evne til å delta i samtaler som høres bemerkelsesverdig menneskelige ut. Imidlertid har to forskere ved University of California, San Diego fastslått at mens ChatGPT nærmer seg å bestå Turing-testen, kommer den til slutt til kort.

I en studie med tittelen "Består GPT-4 Turing-testen?" publisert på arXiv preprint-server, undersøkte Cameron Jones og Benjamin Bergen ytelsen til ChatGPT når det gjaldt å generere samtaler som kunne lure deltakerne til å tro at de snakket med et menneske. De gjennomførte «spill» der deltakerne interagerte med enten et menneske eller en GPT-modell og ble bedt om å identifisere hvilken de kommuniserte med.

Resultatene viste at GPT-4 med suksess lurte deltakerne 41 % av gangene, mens den forrige versjonen, GPT-3.5, oppnådde en bedrageri på bare 5 % til 14 %. Interessant nok klarte menneskelige deltakere å overbevise andre om deres menneskelighet i bare 63% av forsøkene.

Jones og Bergen konkluderte med at ChatGPT ikke består Turing-testen, noe som indikerer at den fortsatt har begrensninger i å generere utdata som ikke kan skilles fra menneskelige svar. Imidlertid understreket de den pågående relevansen av Turing-testen som et rammeverk for å evaluere effektiviteten av maskindialog og forstå menneskelige strategier for å tilpasse seg AI-enheter.

Forskerne fremhevet også de potensielle konsekvensene av at AI-modeller overbevisende etterligner mennesker. Med en suksessrate på 41 % kan bedrag fra AI-modeller ha betydelige sosiale og økonomiske konsekvenser, spesielt i sammenhenger der brukere er mindre klar over at de kan samhandle med en maskin.

Videre identifiserte studien faktorer som deltakerne vurderte når de avgjorde om de var i interaksjon med mennesker eller maskiner. Formaliteten, uformelle, ordlyd, grammatikk, tegnsetting og generisk-klingende svar spilte alle viktige roller for å identifisere AI-genererte samtaler.

Ettersom AI-modeller som ChatGPT fortsetter å utvikle seg og bli mer flytende, understreket forskerne behovet for å spore utviklingen deres og utvikle strategier for å redusere bedrag.

(Kilde: arXiv)