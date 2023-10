By

Les protéines, bêtes de somme de la cellule, jouent un rôle essentiel dans divers processus biologiques. Cependant, ils ne fonctionnent pas de manière isolée et leur activité peut être influencée par d’autres molécules de leur environnement. Dans le cadre d'un nouveau développement passionnant, les chercheurs à l'origine du logiciel révolutionnaire de prédiction de la structure des protéines RoseTTAFold ont introduit un outil puissant qui étend la portée de la conception des protéines en utilisant des techniques d'apprentissage en profondeur pour mieux refléter l'influence de ces molécules (bioRxiv 2023, DOI : 10.1101/2023.10.09.561603). ).

Les algorithmes de prédiction de la structure des protéines, tels qu'AlphaFold et RoseTTAFold, ont transformé le domaine de la biologie structurale ces dernières années. En tirant parti de l’apprentissage automatique et de la formation sur des structures protéiques résolues expérimentalement, ces algorithmes peuvent prédire la structure 3D des protéines uniquement sur la base de leurs séquences d’acides aminés. Les scientifiques ont utilisé ces prédictions pour mieux comprendre la fonction des protéines et concevoir de nouvelles protéines présentant les caractéristiques souhaitées.

Cependant, les modèles existants ont tendance à négliger l’impact des diverses interactions chimiques sur la structure des protéines. "De nombreux processus biologiques impliquent des interactions protéiques avec de petites molécules", explique l'auteur principal David Baker, professeur à l'Université de Washington et développeur de RoseTTAFold. Pour remédier à cette limitation, les chercheurs ont introduit une version mise à jour du modèle appelée RoseTTAFold All-Atom.

Le modèle amélioré peut expliquer la chimie complexe qui se produit lorsque les protéines se lient à de petites molécules ou subissent des modifications covalentes, qui affectent profondément leur structure et leur fonction. En combinant deux approches de modélisation distinctes, les chercheurs ont réussi à former un modèle d'apprentissage automatique capable de représenter un large éventail de molécules dans l'environnement d'une protéine.

Bien que le fonctionnement interne des modèles d’apprentissage automatique puisse être mystérieux, les chercheurs pensent que le nouveau réseau organise les unités moléculaires jusqu’à obtenir une structure protéique plausible. Cette approche révolutionnaire ouvre de nouvelles possibilités pour la conception de protéines en comblant le fossé entre la séquence protéique et la structure fonctionnelle.

L’équipe a formé de manière approfondie RoseTTAFold All-Atom sur divers ensembles de données, ce qui lui a permis d’offrir des prédictions plus précises pour les protéines présentant des interactions moléculaires complexes. Par exemple, le modèle a prédit avec succès la structure des enzymes liées à la fois aux substrats et aux cofacteurs, ainsi que celle des protéines présentant de multiples modifications covalentes. De plus, les chercheurs ont conçu des protéines uniques qui se lient spécifiquement aux petites molécules en utilisant uniquement les apports de ces molécules.

Alors que les versions précédentes de RoseTTAFold se concentraient sur des défis spécifiques, la dernière itération démontre une applicabilité plus large. Les chercheurs envisagent que ce modèle global remplace les versions spécifiques à des tâches de RoseTTAFold, favorisant ainsi l’innovation dans la conception des protéines à tous les niveaux.

Comme pour toute technologie révolutionnaire, il faudra du temps pour comprendre tout le potentiel et les limites de RoseTTAFold All-Atom. La biologiste computationnelle Lauren Porter de la National Library of Medicine reconnaît le potentiel du réseau mais souligne l'importance d'ensembles de formation robustes pour les modèles d'IA. Il est crucial de découvrir toute limitation ou divergence, en particulier lorsqu’une protéine peut adopter des structures différentes en fonction de son contexte. Néanmoins, Porter remarque que cette avancée constitue un pas en avant significatif et prometteur pour l’avenir.

QFP

Qu’est-ce que RoseTTAFold All-Atom ?

RoseTTAFold All-Atom est une version mise à jour du logiciel de prédiction de la structure des protéines RoseTTAFold. Il intègre des techniques d'apprentissage en profondeur pour tenir compte de diverses interactions chimiques et mieux refléter l'environnement des protéines, permettant ainsi des prédictions plus précises de la structure des protéines et facilitant la conception des protéines avec les fonctions souhaitées.

Comment RoseTTAFold All-Atom élargit-il la portée de la conception de protéines ?

RoseTTAFold All-Atom intègre diverses produits chimiques qui se produisent lors des interactions protéiques avec de petites molécules et des modifications covalentes. En entraînant le modèle sur de vastes ensembles de données, il peut générer des prédictions précises pour les structures protéiques complexes, y compris celles impliquant de petites molécules et de nombreuses modifications covalentes, et aider à concevoir des protéines avec des interactions moléculaires complexes.

Quelles sont les limites potentielles du modèle RoseTTAFold All-Atom ?

Comme pour tout modèle d'IA, les performances de RoseTTAFold All-Atom dépendent de ses données d'entraînement. Dans les cas où des données limitées sont disponibles ou dans des situations où les protéines présentent des changements structurels dépendants du contexte, le modèle peut être confronté à des défis. Cependant, les recherches et l’examen en cours de ses capacités aideront à découvrir ses limites et à affiner son application dans la prédiction et la conception de la structure des protéines.