I ricercatori dell’EPFL hanno compiuto un passo avanti nello sviluppo delle reti neurali analogiche creando un algoritmo in grado di addestrarle con la stessa precisione delle reti digitali tradizionali. Questo progresso apre la porta ad alternative più efficienti dal punto di vista energetico nell’hardware di deep learning.

Le reti neurali profonde, come Chat-GPT, hanno un potenziale immenso grazie alla loro capacità di elaborare grandi quantità di dati attraverso l’apprendimento algoritmico. Tuttavia, la loro crescente dimensione, complessità e consumo energetico hanno sollevato preoccupazioni circa il loro impatto ambientale.

Per affrontare questo problema, i ricercatori, guidati da Romain Fleury del Laboratorio di ingegneria delle onde dell'EPFL, hanno esplorato alternative fisiche alle reti digitali. I loro risultati, pubblicati su Science, descrivono in dettaglio un algoritmo per allenare i sistemi fisici che offrono velocità, robustezza e consumo energetico ridotti rispetto ai metodi esistenti.

Il team ha testato con successo il proprio algoritmo su sistemi fisici basati sulle onde, compresi quelli che utilizzano onde sonore, onde luminose e microonde. Ali Momeni, primo autore e ricercatore LWE, evidenzia la versatilità dell'approccio, sottolineando che può essere applicato per allenare qualsiasi sistema fisico.

L’innovazione chiave alla base del loro algoritmo risiede nella sostituzione del tradizionale passaggio all’indietro (backpropagation) con un secondo passaggio in avanti attraverso il sistema fisico. Questo aggiornamento consente di aggiornare localmente ogni livello di rete, eliminando la necessità di un gemello digitale e riducendo il consumo energetico. Inoltre, questo approccio si allinea più strettamente con l’apprendimento umano, rendendolo più biologicamente plausibile.

I ricercatori hanno utilizzato il loro algoritmo fisico di apprendimento locale (PhyLL) per addestrare sistemi acustici e a microonde sperimentali, nonché un sistema ottico modellato, ottenendo una precisione paragonabile all’addestramento basato sulla BP. Inoltre, il metodo ha dimostrato robustezza e adattabilità anche se esposto a disturbi imprevedibili, superando lo stato dell’arte.

Sebbene siano ancora necessari aggiornamenti digitali dei parametri, il team dell’EPFL mira a ridurre al minimo il calcolo digitale nelle iterazioni future. Hanno in programma di implementare il loro algoritmo su un sistema ottico su piccola scala ed esplorarne la scalabilità per reti neurali con centinaia di strati e miliardi di parametri.

Questa svolta nell’addestramento delle reti neurali analogiche promette soluzioni di deep learning più efficienti dal punto di vista energetico e rispettose dell’ambiente. Riducendo sia le dimensioni che il consumo energetico, questi progressi contribuiscono alla sostenibilità delle tecnologie IA.