Le proteine, i cavalli da lavoro della cellula, svolgono un ruolo essenziale in vari processi biologici. Tuttavia, non funzionano in modo isolato e la loro attività può essere influenzata da altre molecole presenti nel loro ambiente. In un nuovo entusiasmante sviluppo, i ricercatori dietro il rivoluzionario software di previsione della struttura delle proteine ​​RoseTTAFold hanno introdotto un potente strumento che amplia l’ambito della progettazione delle proteine ​​utilizzando tecniche di deep learning per riflettere meglio l’influenza di queste molecole (bioRxiv 2023, DOI: 10.1101/2023.10.09.561603 ).

Gli algoritmi di previsione della struttura delle proteine, come AlphaFold e RoseTTAFold, hanno trasformato il campo della biologia strutturale negli ultimi anni. Sfruttando l’apprendimento automatico e l’addestramento su strutture proteiche risolte sperimentalmente, questi algoritmi possono prevedere la struttura 3D delle proteine ​​esclusivamente in base alle loro sequenze di amminoacidi. Gli scienziati hanno utilizzato queste previsioni per acquisire conoscenze sulla funzione delle proteine ​​e progettare nuove proteine ​​con le caratteristiche desiderate.

Tuttavia, i modelli esistenti tendono a trascurare l’impatto delle diverse interazioni chimiche sulla struttura delle proteine. "Molti processi biologici coinvolgono interazioni proteiche con piccole molecole", spiega l'autore senior David Baker, professore all'Università di Washington e sviluppatore di RoseTTAFold. Per ovviare a questa limitazione, i ricercatori hanno ora introdotto una versione aggiornata del modello chiamata RoseTTAFold All-Atom.

Il modello potenziato può spiegare la complessa chimica che si verifica quando le proteine ​​si legano a piccole molecole o subiscono modifiche covalenti, che influenzano profondamente la loro struttura e funzione. Combinando due distinti approcci di modellazione, i ricercatori sono riusciti a formare un modello di apprendimento automatico in grado di rappresentare un'ampia gamma di molecole nell'ambiente di una proteina.

Sebbene il funzionamento interno dei modelli di apprendimento automatico possa essere misterioso, i ricercatori ritengono che la nuova rete organizzi le unità molecolari fino a raggiungere una struttura proteica plausibile. Questo approccio innovativo apre nuove possibilità per la progettazione delle proteine ​​colmando il divario tra la sequenza proteica e la struttura funzionale.

Il team ha ampiamente addestrato RoseTTAFold All-Atom su diversi set di dati, consentendogli di offrire previsioni più accurate per proteine ​​con interazioni molecolari complesse. Ad esempio, il modello è riuscito a prevedere la struttura degli enzimi legati sia ai substrati che ai cofattori, nonché le proteine ​​con molteplici modifiche covalenti. Inoltre, i ricercatori hanno progettato proteine ​​uniche che si legano specificamente a piccole molecole utilizzando solo gli input di tali molecole.

Mentre le versioni precedenti di RoseTTAFold si concentravano su sfide specifiche, l’ultima iterazione dimostra un’applicabilità più ampia. I ricercatori immaginano che questo modello onnicomprensivo sostituisca le versioni di RoseTTAFold specifiche per attività, promuovendo l’innovazione nella progettazione delle proteine ​​a tutti i livelli.

Come con qualsiasi tecnologia innovativa, ci vorrà del tempo per comprendere l’intero potenziale e i limiti di RoseTTAFold All-Atom. La biologa computazionale Lauren Porter della National Library of Medicine riconosce il potenziale della rete ma sottolinea l’importanza di robusti set di addestramento per i modelli di intelligenza artificiale. È fondamentale scoprire eventuali limitazioni o discrepanze, in particolare quando una proteina può adottare strutture diverse a seconda del contesto. Tuttavia, Porter sottolinea che questo progresso rappresenta un passo avanti significativo e promettente per il futuro.

FAQ

Cos'è RoseTTAFold All-Atom?

RoseTTAFold All-Atom è una versione aggiornata del software di previsione della struttura delle proteine ​​RoseTTAFold. Incorpora tecniche di deep learning per tenere conto di varie interazioni chimiche e riflettere meglio l'ambiente delle proteine, consentendo previsioni più accurate della struttura delle proteine ​​e facilitando la progettazione delle proteine ​​con le funzioni desiderate.

In che modo RoseTTAFold All-Atom amplia l'ambito della progettazione delle proteine?

RoseTTAFold All-Atom incorpora diversi prodotti chimici che si verificano durante le interazioni proteiche con piccole molecole e modifiche covalenti. Addestrando il modello su estesi set di dati, può generare previsioni accurate per strutture proteiche complesse, comprese quelle che coinvolgono piccole molecole e numerose modifiche covalenti, e assistere nella progettazione di proteine ​​con complesse interazioni molecolari.

Quali sono i potenziali limiti del modello RoseTTAFold All-Atom?

Come con qualsiasi modello AI, le prestazioni di RoseTTAFold All-Atom dipendono dai suoi dati di addestramento. Nei casi in cui sono disponibili dati limitati o in situazioni in cui le proteine ​​mostrano cambiamenti strutturali dipendenti dal contesto, il modello potrebbe incontrare sfide. Tuttavia, la ricerca in corso e l'esame delle sue capacità aiuteranno a scoprire eventuali limiti e a perfezionare la sua applicazione nella previsione e nella progettazione della struttura delle proteine.