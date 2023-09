Probabilistische grafische Modelle (PGMs) werden seit langem in der Datenanalyse verwendet, um Beziehungen zwischen verschiedenen Merkmalen in einem Datensatz darzustellen und zugrunde liegende Wahrscheinlichkeitsverteilungen zu erfassen. Herkömmliche PGMs weisen jedoch Einschränkungen auf, z. B. Einschränkungen hinsichtlich der Variablentypen und der Arten von Wahrscheinlichkeitsverteilungen, die sie darstellen können.

In ihrem aktuellen Papier, das auf der ECSQARU 2023-Konferenz vorgestellt wurde, schlagen Microsoft-Forscher eine bahnbrechende Lösung für diese Herausforderungen vor. Sie stellen Neural Graphical Models (NGMs) vor, eine neuartige Art von PGM, die tiefe neuronale Netze nutzt, um Wahrscheinlichkeitsfunktionen über einen Bereich zu lernen und darzustellen. NGMs bieten einen vielseitigen Rahmen für die Modellierung von Wahrscheinlichkeitsverteilungen, ohne den Variablentypen oder -verteilungen Einschränkungen aufzuerlegen.

Was NGMs auszeichnet, ist ihre Fähigkeit, verschiedene Arten von Eingabedaten zu verarbeiten, darunter kategorische, kontinuierliche, Bilder und Einbettungen. Sie bieten außerdem effiziente Lösungen für Schlussfolgerungen und Stichproben, was sie zu einem leistungsstarken Werkzeug für die probabilistische Modellierung macht.

Die Kernidee von NGMs besteht darin, tiefe neuronale Netze zu verwenden, um Wahrscheinlichkeitsfunktionen über einen bestimmten Bereich zu parametrisieren. Diese neuronalen Netze können effizient trainiert werden, indem eine Verlustfunktion optimiert wird, die die Einhaltung der angegebenen Abhängigkeitsstruktur erzwingt und an die Daten angepasst wird. Im Gegensatz zu herkömmlichen PGMs sind NGMs nicht durch allgemeine Einschränkungen eingeschränkt und können verschiedene Datentypen nahtlos verarbeiten.

Die Forscher führten experimentelle Validierungen an realen und synthetischen Datensätzen durch, um die Leistung von NGMs zu bewerten. In einem Experiment mit Säuglingssterblichkeitsdaten zeigten NGMs im Vergleich zu anderen Methoden eine beeindruckende Inferenzgenauigkeit und übertrafen die logistische Regression und Bayes'sche Netzwerke. Sie schnitten auch bei kategorialen und ordinalen Variablen auf Augenhöhe mit Explainable Boosting Machines ab. In einem weiteren Experiment mit synthetischen Gaußschen Grafikmodelldaten demonstrierten NGMs ihre Anpassungsfähigkeit an komplexe Datenstrukturen.

NGMs zeichnen sich durch die Vorhersage von Ereignissen mit geringer Wahrscheinlichkeit aus, beispielsweise der Todesursache bei Säuglingen, und unterstreichen ihre Robustheit und ihr Potenzial in Bereichen, in denen die Präzision bei seltenen Ereignissen von entscheidender Bedeutung ist.

Zusammenfassend lässt sich sagen, dass NGMs die probabilistische grafische Modellierung erheblich voranbringen, indem sie die Flexibilität und Ausdruckskraft tiefer neuronaler Netze mit den strukturellen Vorteilen grafischer Modelle kombinieren. Sie befreien Anwender von den Zwängen herkömmlicher PGMs und ermöglichen die Arbeit mit einem breiteren Spektrum an Datentypen und -verteilungen. Aufgrund ihres Erfolgs bei der Bewältigung komplexer Abhängigkeiten und der genauen Vorhersage seltener Ereignisse sind NGMs vielversprechend für die Bewältigung realer Herausforderungen in verschiedenen Bereichen.

Quellen:

– Microsoft-Forschungspapier zu Neural Graphical Models (ECSQARU 2023)

– Säuglingssterblichkeitsdaten der Centers for Disease Control and Prevention (CDC)

– Synthetische Gaußsche grafische Modelldaten

– Lungenkrebsdaten von Kaggle