Lerrel Pinto, ricercatore di informatica presso la New York University, è stato riconosciuto come uno degli Innovatori Under 2023 del MIT Technology Review per il 35. L'obiettivo di Pinto è quello di creare robot che possano diventare parte integrante della nostra vita svolgendo compiti che vanno oltre il semplice passare l'aspirapolvere. Il suo obiettivo è sviluppare robot in grado di assistere nelle faccende domestiche, nell'assistenza agli anziani, nella riabilitazione ed essere presenti quando necessario.

Tuttavia, l’addestramento di robot polivalenti richiede una quantità significativa di dati. Per affrontare questa sfida, Pinto utilizza una tecnica chiamata apprendimento autosupervisionato. Questo approccio prevede che i robot raccolgano dati mentre apprendono, consentendo loro di migliorare le proprie competenze in modo autonomo. Il suo lavoro in questo settore è stato molto acclamato ed è visto come un passo significativo nella combinazione di apprendimento automatico e robotica.

Pinto riconosce che i recenti progressi nell’intelligenza artificiale, in particolare i modelli linguistici di grandi dimensioni, hanno fatto molto affidamento su vasti set di dati derivati ​​da Internet. Tuttavia, questo approccio non è fattibile per l’addestramento dei robot. A differenza delle auto a guida autonoma, che accumulano dati provenienti da milioni di ore trascorse sulla strada, i robot domestici richiedono ore di riprese che descrivono varie attività in contesti diversi.

Nel 2016, Pinto ha raggiunto un traguardo importante creando il set di dati sulla robotica più grande al mondo, in cui i robot generavano ed etichettavano i dati di addestramento senza supervisione umana. Da allora, lui e i suoi colleghi hanno sviluppato algoritmi di apprendimento che consentono ai robot di migliorare imparando dai fallimenti. I fallimenti, come il braccio robotico che non riesce ripetutamente ad afferrare un oggetto, possono essere utilizzati per addestrare modelli che riescono a eseguire il compito.

Un altro approccio che Pinto sta esplorando prevede l’imitazione delle azioni umane. Osservando gli esseri umani aprire le porte, i robot imparano a farlo da soli e aggiungono continuamente al loro set di dati. Più porte vedono l’apertura degli esseri umani, maggiori sono le loro possibilità di aprire con successo nuove porte.

L'attuale progetto di Pinto prevede il reclutamento di volontari per registrare video di se stessi mentre manipolano vari oggetti nelle loro case utilizzando smartphone montati su strumenti economici. Questa raccolta di dati, combinata con efficienti algoritmi di apprendimento, consente ai robot di apprendere comportamenti abili con un tempo di addestramento minimo.

Offrendo ai robot il loro “momento di modello linguistico di grandi dimensioni”, Pinto mira a sbloccare una nuova era nell’intelligenza artificiale. La sua convinzione è che l'intelligenza abbia lo scopo di provocare movimento e cambiamento nel mondo, una capacità posseduta da creature fisiche come i robot.

