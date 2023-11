By

Model języka sztucznej inteligencji ChatGPT wzbudził duże zainteresowanie ze względu na jego zdolność do prowadzenia rozmów, które brzmią wyjątkowo po ludzku. Jednak dwóch badaczy z Uniwersytetu Kalifornijskiego w San Diego ustaliło, że chociaż ChatGPT jest bliski zdania testu Turinga, ostatecznie mu się to nie udaje.

W badaniu zatytułowanym „Czy GPT-4 zdaje test Turinga?” opublikowanych na serwerze preprintów arXiv, Cameron Jones i Benjamin Bergen sprawdzili wydajność ChatGPT w generowaniu rozmów, które mogłyby oszukać uczestników, myśląc, że rozmawiają z człowiekiem. Przeprowadzili „gry”, w których uczestnicy wchodzili w interakcję z człowiekiem lub modelem GPT i zostali poproszeni o określenie, z którym się komunikują.

Wyniki pokazały, że GPT-4 skutecznie oszukał uczestników w 41% przypadków, podczas gdy poprzednia wersja, GPT-3.5, osiągnęła wskaźnik oszustw na poziomie jedynie 5% do 14%. Co ciekawe, uczestnikom badania udało się przekonać innych o swoim człowieczeństwie zaledwie w 63% prób.

Jones i Bergen doszli do wniosku, że ChatGPT nie przechodzi testu Turinga, co wskazuje, że nadal ma ograniczenia w generowaniu wyników nieodróżnialnych od reakcji człowieka. Podkreślili jednak ciągłe znaczenie testu Turinga jako ramy oceny skuteczności dialogu maszynowego i zrozumienia ludzkich strategii dostosowywania się do urządzeń AI.

Badacze zwrócili także uwagę na potencjalne konsekwencje modeli sztucznej inteligencji przekonująco podszywających się pod ludzi. Przy wskaźniku powodzenia wynoszącym 41% oszustwa stosowane przez modele sztucznej inteligencji mogą mieć znaczące skutki społeczne i gospodarcze, szczególnie w kontekstach, w których użytkownicy są mniej świadomi, że mogą wchodzić w interakcję z maszyną.

Ponadto w badaniu zidentyfikowano czynniki, które uczestnicy brali pod uwagę przy ustalaniu, czy wchodzą w interakcję z ludźmi czy maszynami. Formalność, nieformalność, rozwlekłość, gramatyka, interpunkcja i odpowiedzi brzmiące ogólnie odegrały ważną rolę w identyfikowaniu rozmów generowanych przez sztuczną inteligencję.

W miarę jak modele sztucznej inteligencji, takie jak ChatGPT, stale ewoluują i stają się coraz bardziej płynne, badacze podkreślili potrzebę śledzenia ich rozwoju i opracowania strategii ograniczających oszustwa.

Najczęściej zadawane pytania (FAQ)

Co to jest test Turinga?

Test Turinga, zaproponowany przez matematyka Alana Turinga, jest miarą zdolności maszyny do wykazywania inteligentnych zachowań, nieodróżnialnych od zachowań człowieka.

Jak badacze ocenili wydajność ChatGPT?

Badacze przeprowadzili „gry”, w których uczestnicy wchodzili w interakcję z człowiekiem lub ChatGPT i musieli określić, z kim rozmawiają.

Jaki wskaźnik sukcesu osiągnął ChatGPT w oszukiwaniu uczestników?

ChatGPT (GPT-4) skutecznie oszukał uczestników w 41% przypadków, podczas gdy poprzednia wersja, GPT-3.5, osiągnęła wskaźnik oszustw na poziomie od 5% do 14%.

Jakie są potencjalne konsekwencje modeli AI podszywających się pod ludzi?

Jeśli modele sztucznej inteligencji w przekonujący sposób podszywają się pod ludzi, może to mieć rozległe konsekwencje społeczne i gospodarcze, potencjalnie prowadząc do oszustw i zatarcia interakcji człowiek-maszyna.

Jakie czynniki wzięli pod uwagę uczestnicy, identyfikując rozmowy generowane przez sztuczną inteligencję?

Uczestnicy zwracali uwagę na takie czynniki, jak formalność, nieformalność, rozwlekłość, gramatyka, interpunkcja i odpowiedzi brzmiące ogólnie, aby określić, czy komunikują się z ludźmi czy maszynami.

(Źródło: arXiv)