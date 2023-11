Proteiner, cellens arbeidshester, spiller viktige roller i ulike biologiske prosesser. Imidlertid fungerer de ikke isolert, og deres aktivitet kan påvirkes av andre molekyler i miljøet. I en spennende ny utvikling har forskere bak den revolusjonerende programvaren for prediksjon av proteinstrukturer RoseTTAFold introdusert et kraftig verktøy som utvider omfanget av proteindesign ved hjelp av dyplæringsteknikker for bedre å reflektere innflytelsen til disse molekylene (bioRxiv 2023, DOI: 10.1101/2023.10.09.561603 ).

Algoritmer for prediksjon av proteinstruktur, som AlphaFold og RoseTTAFold, har transformert feltet strukturell biologi de siste årene. Ved å utnytte maskinlæring og trening på eksperimentelt løste proteinstrukturer, kan disse algoritmene forutsi 3D-strukturen til proteiner utelukkende basert på deres aminosyresekvenser. Forskere har brukt disse spådommene for å få innsikt i proteinfunksjon og designe nye proteiner med ønskede egenskaper.

Imidlertid har de eksisterende modellene en tendens til å overse virkningen av forskjellige kjemiske interaksjoner på proteinstrukturen. "Mange biologiske prosesser involverer proteininteraksjoner med små molekyler," forklarer seniorforfatter David Baker, professor ved University of Washington og utvikler av RoseTTAFold. For å løse denne begrensningen har forskerne nå introdusert en oppdatert versjon av modellen kalt RoseTTAFold All-Atom.

Den forbedrede modellen kan redegjøre for den intrikate kjemien som oppstår når proteiner binder seg til små molekyler eller gjennomgår kovalente modifikasjoner, som har dyptgående innvirkning på deres struktur og funksjon. Ved å kombinere to distinkte modelleringstilnærminger, trente forskerne en maskinlæringsmodell som kan representere et bredt spekter av molekyler i et proteins miljø.

Selv om den indre funksjonen til maskinlæringsmodeller kan være mystisk, mener forskerne at det nye nettverket ordner de molekylære enhetene til det oppnår en plausibel proteinstruktur. Denne banebrytende tilnærmingen åpner for nye muligheter for proteindesign ved å bygge bro mellom proteinsekvens og funksjonell struktur.

Teamet trente RoseTTAFold All-Atom omfattende på forskjellige datasett, noe som gjorde det i stand til å tilby mer nøyaktige spådommer for proteiner med komplekse molekylære interaksjoner. For eksempel forutså modellen vellykket strukturen til enzymer bundet til både substrater og kofaktorer, samt proteiner med flere kovalente modifikasjoner. Dessuten designet forskerne unike proteiner som binder seg spesifikt til små molekyler ved å bruke bare inngangene til disse molekylene.

Mens de tidligere versjonene av RoseTTAFold fokuserte på spesifikke utfordringer, viser den siste iterasjonen bredere anvendelighet. Forskerne ser for seg at denne altomfattende modellen erstatter oppgavespesifikke versjoner av RoseTTAFold, og fremmer innovasjon innen proteindesign over hele linjen.

Som med all banebrytende teknologi, vil det ta tid å forstå det fulle potensialet og begrensningene til RoseTTAFold All-Atom. Beregningsbiolog Lauren Porter ved National Library of Medicine erkjenner potensialet til nettverket, men understreker viktigheten av robuste treningssett for AI-modeller. Det er avgjørende å avdekke eventuelle begrensninger eller avvik, spesielt når et protein kan adoptere forskjellige strukturer avhengig av konteksten. Likevel bemerker Porter at denne fremgangen er et betydelig skritt fremover og lover for fremtiden.

FAQ

Hva er RoseTTAFold All-Atom?

RoseTTAFold All-Atom er en oppdatert versjon av prediksjonsprogramvaren for proteinstruktur RoseTTAFold. Den inneholder dyplæringsteknikker for å ta hensyn til ulike kjemiske interaksjoner og bedre reflektere proteiners miljø, noe som muliggjør mer nøyaktige spådommer av proteinstruktur og tilrettelegger for proteindesign med ønskede funksjoner.

Hvordan utvider RoseTTAFold All-Atom omfanget av proteindesign?

RoseTTAFold All-Atom inkorporerer mangfoldig kjemi som oppstår under proteininteraksjoner med små molekyler og kovalente modifikasjoner. Ved å trene modellen på omfattende datasett, kan den generere nøyaktige spådommer for komplekse proteinstrukturer, inkludert de som involverer små molekyler og mange kovalente modifikasjoner, og hjelpe til med å designe proteiner med intrikate molekylære interaksjoner.

Hva er de potensielle begrensningene til RoseTTAFold All-Atom-modellen?

Som med alle AI-modeller avhenger ytelsen til RoseTTAFold All-Atom av treningsdataene. I tilfeller der begrensede data er tilgjengelige eller i situasjoner der proteiner viser kontekstavhengige strukturelle endringer, kan modellen møte utfordringer. Imidlertid vil pågående forskning og undersøkelse av dens evner bidra til å avdekke eventuelle begrensninger og avgrense anvendelsen i proteinstrukturprediksjon og design.