Ang mga mananaliksik mula sa Huazhong University of Science and Technology ay nakabuo ng bagong AI-based na pamamaraan na tinatawag na "Meta-Sorter" upang mapabuti ang biome labeling para sa mga sample ng microbiome. Ang pag-aaral, na inilathala sa journal Environmental Science and Ecotechnology, ay nagpapakita kung paano ginagamit ng Meta-Sorter ang mga neural network at paglilipat ng mga diskarte sa pag-aaral upang harapin ang hamon ng hindi kumpletong impormasyon sa database ng MGnify.

Ang Meta-Sorter na diskarte ay binubuo ng dalawang pangunahing hakbang. Una, ang isang modelo ng neural network ay itinayo gamit ang higit sa 118,000 microbial sample mula sa 134 biomes at ang kanilang kaukulang biome ontology. Nakakamit ng modelong ito ang isang kahanga-hangang average na AUROC (Area Under the Receiver Operating Characteristic curve) na 0.896, tumpak na pag-uuri ng mga sample na may detalyadong biome na impormasyon.

Kasama sa ikalawang hakbang ang paggamit ng transfer learning na may mga bagong ipinakilalang sample na may iba't ibang katangian. Ang mga mananaliksik ay nagsama ng 34,209 bagong sample mula sa 35 biomes, kabilang ang walong nobela, sa transfer neural network model. Nagresulta ito sa isang natitirang average na AUROC na 0.989, na epektibong hinuhulaan ang impormasyon ng biome para sa mga bagong ipinakilalang sample na may label na "Mixed biome."

Ang Meta-Sorter ay nagpapakita ng pangkalahatang rate ng katumpakan na 96.7% sa pag-uuri ng mga sample na may hindi kumpletong biome annotation. Niresolba ng tagumpay na ito ang mga isyu ng mga error sa pag-cascade at nagbubukas ng mga bagong posibilidad para sa pagtuklas ng kaalaman sa pagsasaliksik sa kapaligiran at iba pang mga disiplinang siyentipiko.

Bukod pa rito, pinipino ng Meta-Sorter ang mga biome annotation para sa mga sample na kulang sa annotated at mis-annotated. Ang awtomatikong pagtatalaga nito ng mga tumpak na pag-uuri sa mga hindi tiyak na sample ay nagbibigay ng mahahalagang insight na higit pa sa orihinal na panitikan. Ang pagkakaiba-iba ng mga sample sa mga partikular na kategorya ng kapaligiran ay nagpapahusay sa pagiging maaasahan at bisa ng mga konklusyon sa pananaliksik.

Habang patuloy na umuunlad ang mga standardized na protocol para sa pagsusumite ng data at pagsasama ng meta-data, inaasahang babaguhin ng Meta-Sorter ang pagsusuri at interpretasyon ng mga sample ng microbial na komunidad. Ito ay magbibigay-daan sa mas tumpak at insightful na mga pagtuklas sa larangan ng microbiome research at higit pa.

Source:

Nan Wang et al, Pinipino ang pag-label ng biome para sa malakihang mga sample ng microbial na komunidad: Pag-gamit ng mga neural network at paglilipat ng pag-aaral, Environmental Science at Ecotechnology (2023). DOI: 10.1016/j.ese.2023.100304