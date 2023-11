By

Le modèle de langage d'intelligence artificielle ChatGPT a attiré une attention particulière pour sa capacité à engager des conversations qui semblent remarquablement humaines. Cependant, deux chercheurs de l’Université de Californie à San Diego ont déterminé que même si ChatGPT est sur le point de réussir le test de Turing, il échoue finalement.

Dans une étude intitulée « GPT-4 réussit-il le test de Turing ? » publié sur le serveur de préimpression arXiv, Cameron Jones et Benjamin Bergen ont examiné les performances de ChatGPT dans la génération de conversations qui pourraient tromper les participants en leur faisant croire qu'ils conversaient avec un humain. Ils ont organisé des « jeux » dans lesquels les participants interagissaient avec un modèle humain ou un modèle GPT et il leur était demandé d'identifier avec lequel ils communiquaient.

Les résultats ont montré que GPT-4 a réussi à tromper les participants dans 41 % des cas, tandis que la version précédente, GPT-3.5, atteignait un taux de tromperie de seulement 5 % à 14 %. Il est intéressant de noter que les participants humains ont réussi à convaincre les autres de leur humanité dans seulement 63 % des essais.

Jones et Bergen ont conclu que ChatGPT ne réussit pas le test de Turing, indiquant qu'il a encore des limites dans la génération de résultats impossibles à distinguer des réponses humaines. Cependant, ils ont souligné la pertinence actuelle du test de Turing en tant que cadre pour évaluer l’efficacité du dialogue machine et comprendre les stratégies humaines pour s’adapter aux appareils d’IA.

Les chercheurs ont également souligné les conséquences potentielles des modèles d’IA se faisant passer pour des personnes de manière convaincante. Avec un taux de réussite de 41 %, la tromperie des modèles d’IA pourrait avoir des impacts sociaux et économiques importants, notamment dans des contextes où les utilisateurs sont moins conscients qu’ils pourraient interagir avec une machine.

En outre, l’étude a identifié des facteurs que les participants ont pris en compte pour déterminer s’ils interagissaient avec des humains ou des machines. Le formalisme, l’informalité, la verbosité, la grammaire, la ponctuation et les réponses à consonance générique ont tous joué un rôle important dans l’identification des conversations générées par l’IA.

Alors que les modèles d’IA comme ChatGPT continuent d’évoluer et de devenir plus fluides, les chercheurs ont souligné la nécessité de suivre leur développement et de développer des stratégies pour atténuer la tromperie.

Foire Aux Questions (FAQ)

Qu'est-ce que le test de Turing ?

Le test de Turing, proposé par le mathématicien Alan Turing, est une mesure de la capacité d'une machine à présenter un comportement intelligent impossible à distinguer de celui d'un humain.

Comment les chercheurs ont-ils évalué les performances de ChatGPT ?

Les chercheurs ont mené des « jeux » dans lesquels les participants interagissaient soit avec un humain, soit avec ChatGPT et devaient déterminer avec lequel ils conversaient.

Quel taux de réussite ChatGPT a-t-il atteint pour tromper les participants ?

ChatGPT (GPT-4) a réussi à tromper les participants dans 41 % des cas, tandis que la version précédente, GPT-3.5, atteignait un taux de tromperie de 5 % à 14 %.

Quelles sont les conséquences potentielles des modèles d’IA usurpant l’identité de personnes ?

Si les modèles d’IA usurpent l’identité de personnes de manière convaincante, cela pourrait avoir de vastes conséquences sociales et économiques, conduisant potentiellement à la tromperie et à la confusion des interactions homme-machine.

Quels facteurs les participants ont-ils pris en compte lors de l’identification des conversations générées par l’IA ?

Les participants ont prêté attention à des facteurs tels que la formalité, le caractère informel, la verbosité, la grammaire, la ponctuation et les réponses à consonance générique pour déterminer s'ils communiquaient avec des humains ou des machines.

(Source : arXiv)