Jezikovni model umetne inteligence ChatGPT je pritegnil veliko pozornosti zaradi svoje sposobnosti vključevanja v pogovore, ki zvenijo izjemno človeško. Vendar pa sta dva raziskovalca na kalifornijski univerzi v San Diegu ugotovila, da je ChatGPT sicer skoraj prestal Turingov test, vendar na koncu ne uspe.

V študiji z naslovom "Ali GPT-4 prestane Turingov test?" Cameron Jones in Benjamin Bergen, objavljen na strežniku za prednatis arXiv, sta preučila delovanje ChatGPT pri ustvarjanju pogovorov, ki bi lahko udeležence zavedli, da mislijo, da se pogovarjajo s človekom. Izvajali so »igre«, v katerih so udeleženci sodelovali s človeškim ali GPT modelom in morali so ugotoviti, s katerim komunicirajo.

Rezultati so pokazali, da je GPT-4 uspešno preslepil udeležence v 41% primerov, medtem ko je prejšnja različica, GPT-3.5, dosegla stopnjo zavajanja le od 5% do 14%. Zanimivo je, da je človeškim udeležencem uspelo druge prepričati o svoji človečnosti v samo 63 % poskusov.

Jones in Bergen sta ugotovila, da ChatGPT ne prestane Turingovega testa, kar kaže, da ima še vedno omejitve pri ustvarjanju rezultatov, ki jih ni mogoče razlikovati od človeških odzivov. Vendar pa so poudarili stalno pomembnost Turingovega testa kot okvira za ocenjevanje učinkovitosti strojnega dialoga in razumevanja človeških strategij za prilagajanje napravam AI.

Raziskovalci so poudarili tudi morebitne posledice modelov AI, ki prepričljivo posnemajo ljudi. S 41-odstotno stopnjo uspešnosti bi lahko imelo zavajanje z modeli umetne inteligence pomembne družbene in gospodarske posledice, zlasti v kontekstih, kjer se uporabniki manj zavedajo, da morda komunicirajo s strojem.

Poleg tega je študija opredelila dejavnike, ki so jih udeleženci upoštevali pri ugotavljanju, ali so v interakciji z ljudmi ali stroji. Formalnost, neformalnost, besednost, slovnica, ločila in generično zveneči odgovori so imeli pomembno vlogo pri prepoznavanju pogovorov, ki jih je ustvarila umetna inteligenca.

Ker se modeli umetne inteligence, kot je ChatGPT, še naprej razvijajo in postajajo bolj tekoči, so raziskovalci poudarili, da je treba slediti njihovemu razvoju in razviti strategije za ublažitev goljufij.

(Vir: arXiv)