Google va presentar recentment el seu darrer conjunt de models d'IA anomenat Gemini, però la companyia ara s'enfronta a acusacions d'enganyar els espectadors sobre les capacitats de la seva IA. En un article d'opinions publicat per Bloomberg, el columnista Parmy Olson afirma que Google va tergiversar el poder de Gemini en una demostració de vídeo recent.

El vídeo mostrava les capacitats multimodals de Gemini, combinant els missatges de conversa parlats amb el reconeixement d'imatges. L'IA semblava reconèixer imatges ràpidament, respondre en qüestió de segons i predir amb precisió què passaria després. Tanmateix, fer clic a la descripció del vídeo va revelar una important exempció de responsabilitat de Google: "Als efectes d'aquesta demostració, la latència s'ha reduït i les sortides de Gemini s'han escurçat per a la brevetat".

Olson va argumentar que aquesta exempció de responsabilitat contradeia el que semblava suggerir Google al vídeo, que era que Gemini podia participar en converses de veu en temps real mentre mirava i responia al seu entorn. Google va admetre que la demostració de vídeo no es va produir en temps real, sinó que va utilitzar marcs d'imatge fixa i indicacions de text perquè Gemini respongués.

Tot i que és habitual que les empreses editin vídeos de demostració per evitar problemes tècnics, Google s'ha enfrontat a l'escepticisme en el passat pel que fa a l'autenticitat de les seves demostracions d'IA. La manca de soroll ambiental i les interaccions massa útils a la seva demostració Duplex van generar dubtes sobre la seva precisió. Els vídeos pregravats de models d'IA també s'han trobat amb sospita, com ara el llançament de l'Ernie Bot de Baidu.

Segons Olson, les accions de Google es poden veure com un intent d'enganyar els espectadors i desviar l'atenció del fet que Gemini encara es queda per darrere del GPT d'OpenAI. Tanmateix, Google va defensar la seva demostració, amb Oriol Vinyals, vicepresident de Recerca i Deep Learning Lead de DeepMind de Google, afirmant que el vídeo és una representació de com podrien ser les interaccions dels usuaris amb Gemini.

Per tal de recuperar la confiança i inspirar els desenvolupadors, Olson suggereix que Google proporcioni als periodistes i desenvolupadors experiències pràctiques del producte. En permetre a la gent provar Gemini en una beta pública i mostrar les seves veritables capacitats, Google estaria millor posicionat per promocionar l'IA sense necessitat de vídeos editats que puguin donar una impressió falsa.