Lerrel Pinto, chercheur en informatique à l'Université de New York, a été reconnu comme l'un des innovateurs de moins de 2023 ans 35 du MIT Technology Review. L'objectif de Pinto est de créer des robots qui peuvent faire partie intégrante de nos vies en effectuant des tâches allant au-delà du simple passage de l'aspirateur. Son objectif est de développer des robots capables d'aider aux tâches ménagères, aux soins aux personnes âgées, à la réadaptation et d'être présents en cas de besoin.

Cependant, former des robots polyvalents nécessite une quantité importante de données. Pour relever ce défi, Pinto utilise une technique appelée apprentissage auto-supervisé. Cette approche implique que des robots collectent des données au fur et à mesure de leur apprentissage, ce qui leur permet d'améliorer leurs compétences de manière autonome. Ses travaux dans ce domaine ont été très appréciés et sont considérés comme une étape importante dans la combinaison de l’apprentissage automatique et de la robotique.

Pinto reconnaît que les progrès récents en matière d’IA, en particulier les grands modèles linguistiques, reposent largement sur de vastes ensembles de données provenant d’Internet. Cependant, cette approche n’est pas réalisable pour entraîner des robots. Contrairement aux voitures autonomes, qui accumulent des données provenant de millions d’heures de route, les robots domestiques nécessitent des heures d’images illustrant diverses tâches dans différents contextes.

En 2016, Pinto a franchi une étape importante en créant le plus grand ensemble de données robotiques au monde, dans lequel les robots généraient et étiquetaient leurs données d'entraînement sans supervision humaine. Depuis, lui et ses collègues ont développé des algorithmes d’apprentissage qui permettent aux robots de s’améliorer en apprenant de leurs échecs. Les échecs, tels qu'un bras de robot qui ne parvient pas à saisir un objet à plusieurs reprises, peuvent être utilisés pour former des modèles qui réussissent à accomplir la tâche.

Une autre approche explorée par Pinto consiste à imiter les actions humaines. En observant les humains ouvrir les portes, les robots apprennent à le faire eux-mêmes et à enrichir continuellement leur ensemble de données. Plus ils voient de portes s’ouvrir par les humains, plus grandes sont leurs chances de réussir à en ouvrir de nouvelles.

Le projet actuel de Pinto consiste à recruter des volontaires pour enregistrer des vidéos d'eux-mêmes manipulant divers objets chez eux à l'aide de smartphones montés sur des outils peu coûteux. Cette collecte de données, combinée à des algorithmes d’apprentissage efficaces, permet aux robots d’apprendre des comportements adroits avec un temps de formation minimal.

En donnant aux robots leur « moment de grand modèle de langage », Pinto vise à ouvrir une nouvelle ère dans l’IA. Sa conviction est que l’intelligence est censée provoquer des mouvements et des changements dans le monde, une capacité que possèdent les créatures physiques comme les robots.

