Les modèles graphiques probabilistes (PGM) sont utilisés depuis longtemps dans l'analyse des données pour représenter les relations entre diverses caractéristiques d'un ensemble de données et capturer les distributions de probabilité sous-jacentes. Cependant, les PGM traditionnels présentent des limites, telles que des restrictions sur les types de variables et les types de distributions de probabilité qu'elles peuvent représenter.

Dans leur récent article présenté lors de la conférence ECSQARU 2023, les chercheurs de Microsoft proposent une solution révolutionnaire à ces défis. Ils introduisent des modèles graphiques neuronaux (NGM), un nouveau type de PGM qui exploite des réseaux neuronaux profonds pour apprendre et représenter des fonctions de probabilité sur un domaine. Les NGM offrent un cadre polyvalent pour modéliser les distributions de probabilité sans imposer de contraintes sur les types de variables ou les distributions.

Ce qui distingue les NGM, c'est leur capacité à gérer différents types de données d'entrée, notamment les données catégorielles, continues, les images et les intégrations. Ils fournissent également des solutions efficaces pour l’inférence et l’échantillonnage, ce qui en fait un outil puissant pour la modélisation probabiliste.

L'idée principale des NGM est d'utiliser des réseaux de neurones profonds pour paramétrer des fonctions de probabilité sur un domaine donné. Ces réseaux de neurones peuvent être formés efficacement en optimisant une fonction de perte qui impose le respect de la structure de dépendance spécifiée et s'adapte aux données. Contrairement aux PGM traditionnels, les NGM ne sont pas limités par des contraintes communes et peuvent gérer de manière transparente divers types de données.

Les chercheurs ont mené des validations expérimentales sur des ensembles de données réelles et synthétiques pour évaluer les performances des NGM. Dans une expérience utilisant des données sur la mortalité infantile, les NGM ont démontré une précision d’inférence impressionnante par rapport à d’autres méthodes, surpassant la régression logistique et les réseaux bayésiens. Ils ont également obtenu des résultats comparables à ceux des Explainable Boosting Machines pour les variables catégorielles et ordinales. Dans une autre expérience avec des données synthétiques du modèle graphique gaussien, les NGM ont démontré leur adaptabilité à des structures de données complexes.

Les NGM excellent dans la prévision d’événements à faible probabilité, tels que la cause du décès des nourrissons, soulignant leur robustesse et leur potentiel dans des domaines où la précision sur des résultats peu fréquents est essentielle.

En conclusion, les NGM font progresser considérablement la modélisation graphique probabiliste en combinant la flexibilité et l’expressivité des réseaux neuronaux profonds avec les avantages structurels des modèles graphiques. Ils libèrent les praticiens des contraintes des PGM traditionnels et permettent de travailler avec un plus large éventail de types et de distributions de données. Grâce à leur capacité à gérer des dépendances complexes et à prédire avec précision des événements rares, les NGM sont très prometteurs pour relever les défis du monde réel dans divers domaines.

Sources:

– Document de recherche Microsoft sur les modèles graphiques neuronaux (ECSQARU 2023)

– Données sur la mortalité infantile des Centers for Disease Control and Prevention (CDC)

– Données du modèle graphique gaussien synthétique

– Données sur le cancer du poumon de Kaggle