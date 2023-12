'n Span rekenaarwetenskaplikes by die Oak Ridge National Laboratory (ORNL) het massiewe datastelle geskep en vrygestel wat die ultraviolet sigbare spektrale eienskappe van meer as 10 miljoen organiese molekules bevat. Hierdie baanbrekende poging is daarop gemik om ons begrip van hoe molekules met lig in wisselwerking is te verbeter, wat noodsaaklik is om hul elektroniese en optiese eienskappe te ontbloot. Hierdie eiendomme het beduidende toepassings in verskeie velde, insluitend die ontwikkeling van sonselle en mediese beeldstelsels.

Met behulp van hoëprestasie-rekenaarhulpbronne beskikbaar by die Oak Ridge Leadership Computing Facility, het die navorsers kwantumchemie-berekeninge uitgevoer om hierdie uitgebreide datastelle te genereer. Veelvuldige atomistiese materiaal modellering berekeninge is uitgevoer vir elke organiese molekule om verskillende opgewekte toestand eienskappe van belang te bereken. Die bevindinge van hierdie studie is in Scientific Data gepubliseer.

Die hoofdoelwit agter die skep van hierdie oopbrondatastelle is om 'n diepleermodel op te lei wat in staat is om molekules met spesifieke opto-elektroniese en fotoreaktiwiteitseienskappe te identifiseer. Hierdie benadering bied 'n vinniger en meer doeltreffende alternatief vir huidige metodes wat vir molekulêre ontwerp gebruik word.

Hoofskrywer Massimiliano Lupo Pasini, 'n datawetenskaplike by ORNL se afdeling Rekenkundige Wetenskappe en Ingenieurswese, het die belangrikheid van die gebruik van diepleermodelle in molekulêre ontwerp verduidelik. Hy het gesê: "Die gebruik van DL-modelle vir molekulêre ontwerp is noodsaaklik omdat die chemiese ruimte wat ondersoek moet word vir die soektog na hierdie molekules uiters groot is." Tradisionele eksperimente en eerste-beginsels-berekeninge is eenvoudig onbekostigbaar as gevolg van hul arbeidsintensiewe aard of hul oorweldigende berekeningsvereistes. Diep leermodelle bied 'n belowende oplossing om hierdie beperkings te oorkom.

Om die uitdagings wat verband hou met die bestuur van groot volumes data aan te spreek, het die navorsers 'n skaalbare werkvloeisagteware ontwikkel in samewerking met ORNL-rekenaarwetenskaplike Kshitij Mehta. Hierdie sagteware verseker die behoorlike hantering van lêers wat deur die kwantummeganika-kode gegenereer word sonder om die lêerstelsel te oorweldig.

Die span het die GDB-9-Ex-datastel suksesvol gegenereer, wat ongeveer 96,766 10.5 molekules bevat, as 'n bewys-van-konsep. Hulle het getoon dat die ontwerpte werkvloei effektief die posisie en intensiteit van pieke in die ultraviolet-sigbare spektrum voorspel. Aangemoedig deur hierdie resultaat, het die navorsers hul pogings uitgebrei en die ORNL_AISD-Ex-datastel geskep, wat meer as XNUMX miljoen molekules insluit. Hierdie datastel verskaf waardevolle inligting oor elke molekule se opwekkingsmodusse en HOMO-LUMO gaping, wat stabiliteit meet. Met hierdie data kan 'n diep leermodel soos HydraGNN potensieel belowende molekules vir verskillende toepassings doeltreffend identifiseer.

Die komende referaat sal die resultate van HydraGNN se opleiding oor hierdie datastelle en die molekulêre ontdekkings wat gemaak is, uiteensit. Hierdie innoverende benadering tot molekulêre ontwerp het die potensiaal om die veld te revolusioneer en die ontwikkeling van nuwe materiale met pasgemaakte eienskappe te bespoedig.