Un nuovo studio condotto da neuroscienziati del MIT ha rivelato che le reti neurali profonde, pur essendo in grado di identificare oggetti come i sistemi sensoriali umani, hanno strategie di riconoscimento che divergono dalla percezione umana. Quando venivano sollecitate a produrre stimoli simili a un dato input, queste reti spesso generavano immagini e suoni distorti o irriconoscibili. Ciò indica che le reti neurali sviluppano invarianze uniche, che differiscono significativamente dai modelli percettivi umani. Tuttavia, lo studio ha scoperto che l’uso della formazione contraddittoria potrebbe rendere gli stimoli generati dai modelli più riconoscibili per gli esseri umani, sebbene non identici agli input originali.

Le reti neurali profonde sono modelli computazionali che possono essere addestrati a riconoscere immagini o parole, indipendentemente dalle variazioni di colore, tono o altri fattori. Lo studio del MIT ha scoperto che quando questi modelli venivano utilizzati per generare stimoli che suscitavano la stessa risposta di uno specifico input naturale, spesso producevano immagini o suoni irriconoscibili per gli osservatori umani. Ciò suggerisce che questi modelli sviluppano le proprie invarianze idiosincratiche, rispondendo allo stesso modo a stimoli con caratteristiche molto diverse.

Secondo Joshua McDermott, professore associato di scienze del cervello e cognitive al MIT, questa ricerca fornisce un nuovo metodo per valutare quanto efficacemente questi modelli imitano la percezione sensoriale umana. McDermott ritiene che questi modelli dovrebbero essere sottoposti a una serie di test per valutarne l'accuratezza.

Lo studio, condotto da Jenelle Feather, dottoranda al MIT, mostra che le reti neurali profonde possono generare ciò che i ricercatori chiamano “metameri modello”, stimoli che producono la stessa risposta all’interno del modello di un dato stimolo di esempio. Tuttavia, i metameri prodotti dai modelli erano tipicamente irriconoscibili e privi di caratteristiche interpretabili che gli esseri umani potrebbero utilizzare per classificare un oggetto o una parola. Ciò suggerisce che i modelli hanno sviluppato invarianze uniche che differiscono dai sistemi percettivi umani.

Lo studio ha concluso che le reti neurali profonde presentano invarianze idiosincratiche, nel senso che sono invarianti rispetto a particolari dimensioni nello spazio degli stimoli. Inoltre, ogni modello ha sviluppato le proprie invarianze uniche. Quando questi metameri venivano mostrati ad altri modelli, rimanevano irriconoscibili sia per i secondi modelli che per gli osservatori umani.

Questo studio evidenzia la necessità di comprendere ulteriormente le differenze percettive tra le reti neurali profonde e i sistemi sensoriali umani. Sottolinea inoltre l’importanza della ricerca continua per migliorare l’accuratezza e l’efficacia di questi modelli nell’imitare la percezione umana.

Fonte:

– Notizie del MIT – https://news.mit.edu/2022/deep-neural-networks-mimicking-human-perception-0301