Forscher der EPFL haben einen Durchbruch bei der Entwicklung analoger neuronaler Netze erzielt, indem sie einen Algorithmus entwickelt haben, der sie genauso genau trainieren kann wie herkömmliche digitale Netze. Dieser Fortschritt öffnet die Tür zu energieeffizienteren Alternativen in der Deep-Learning-Hardware.

Tiefe neuronale Netze wie Chat-GPT haben aufgrund ihrer Fähigkeit, große Datenmengen durch algorithmisches Lernen zu verarbeiten, ein enormes Potenzial. Allerdings haben ihre zunehmende Größe, Komplexität und ihr Energieverbrauch Bedenken hinsichtlich ihrer Auswirkungen auf die Umwelt geweckt.

Um dieses Problem anzugehen, untersuchten Forscher unter der Leitung von Romain Fleury vom Labor für Wellentechnik der EPFL physikalische Alternativen zu digitalen Netzwerken. Ihre in Science veröffentlichten Ergebnisse beschreiben einen Algorithmus zum Training physikalischer Systeme, der im Vergleich zu bestehenden Methoden eine höhere Geschwindigkeit, Robustheit und einen geringeren Stromverbrauch bietet.

Das Team testete seinen Algorithmus erfolgreich an wellenbasierten physikalischen Systemen, darunter solchen, die Schallwellen, Lichtwellen und Mikrowellen nutzen. Ali Momeni, Erstautor und LWE-Forscher, hebt die Vielseitigkeit des Ansatzes hervor und weist darauf hin, dass er zum Trainieren jedes physischen Systems angewendet werden kann.

Die wichtigste Innovation hinter ihrem Algorithmus besteht darin, den traditionellen Rückwärtsdurchlauf (Backpropagation) durch einen zweiten Vorwärtsdurchlauf durch das physische System zu ersetzen. Dieses Update ermöglicht die lokale Aktualisierung jeder Netzwerkschicht, wodurch die Notwendigkeit eines digitalen Zwillings entfällt und der Energieverbrauch gesenkt wird. Darüber hinaus orientiert sich dieser Ansatz besser am menschlichen Lernen und macht ihn biologisch plausibler.

Die Forscher nutzten ihren physikalischen lokalen Lernalgorithmus (PhyLL), um experimentelle akustische und Mikrowellensysteme sowie ein modelliertes optisches System zu trainieren und erreichten dabei eine vergleichbare Genauigkeit wie BP-basiertes Training. Darüber hinaus zeigte die Methode Robustheit und Anpassungsfähigkeit, selbst wenn sie unvorhersehbaren Störungen ausgesetzt war, und übertraf damit den Stand der Technik.

Obwohl weiterhin digitale Aktualisierungen der Parameter erforderlich sind, ist das EPFL-Team bestrebt, die digitale Berechnung in zukünftigen Iterationen so gering wie möglich zu halten. Sie planen, ihren Algorithmus in einem kleinen optischen System zu implementieren und seine Skalierbarkeit für neuronale Netze mit Hunderten von Schichten und Milliarden von Parametern zu untersuchen.

Dieser Durchbruch im analogen neuronalen Netztraining verspricht energieeffizientere und umweltfreundlichere Deep-Learning-Lösungen. Durch die Reduzierung von Größe und Stromverbrauch tragen diese Fortschritte zur Nachhaltigkeit von KI-Technologien bei.

