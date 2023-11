Ang Stability AI, isang promising AI startup, ay naglabas ng isang groundbreaking na produkto na tinatawag na Stable Video Diffusion. Ang modelong AI na ito ay may kakayahang baguhin ang mga kasalukuyang larawan sa mga video sa pamamagitan ng pag-animate sa mga ito, at isa ito sa ilang mga modelong bumubuo ng video na magagamit para sa open-source na paggamit. Ang paglulunsad ng Stable Video Diffusion ay dumating sa panahon na ang kaguluhan sa OpenAI ay nangingibabaw sa mga headline, na nagpapakita ng katatagan ng Stability AI at nakatutok sa kanilang roadmap ng produkto.

Ang Stable Video Diffusion ay kasalukuyang nasa yugto ng "pananaliksik na preview," kung saan ang mga interesadong user ay dapat sumang-ayon sa mga partikular na tuntunin ng paggamit. Binabalangkas ng mga terminong ito ang nilalayong aplikasyon ng Stable Video Diffusion, gaya ng mga tool na pang-edukasyon at malikhaing, pati na rin ang disenyo at iba pang mga artistikong proseso. Gayunpaman, mahalagang tandaan na ang makatotohanan o totoong mga representasyon ng mga tao o kaganapan ay hindi kabilang sa mga nilalayong gamit.

Bagama't ang inobasyong ito mula sa Stability AI ay may malaking potensyal, may mga alalahanin tungkol sa potensyal na maling paggamit nito. Isinasaalang-alang ang kasaysayan ng mga katulad na preview ng pananaliksik sa AI, kabilang ang mga nakaraang release ng Stability AI, may posibilidad na ang modelo ay maaaring mapagsamantalahan sa dark web. Upang malabanan ito, napakahalaga para sa Stable Video Diffusion na magkaroon ng built-in na filter ng nilalaman upang maiwasan ang pang-aabuso. Ang nakaraang paglabas ng modelo ng Stability AI, ang Stable Diffusion, ay nagamit nang mali upang lumikha ng hindi sinasang-ayunan na deepfake na pang-adultong nilalaman, na itinatampok ang kahalagahan ng regulasyon ng nilalaman.

Ang Stable Video Diffusion ay binubuo ng dalawang modelo, ang SVD at SVD-XT. Ang SVD ay maaaring mag-transform ng mga still image sa 576×1024 na video na may 14 na frame, habang ang SVD-XT ay nagpapataas ng mga frame sa 24. Ang parehong mga modelo ay may kakayahang bumuo ng mga video sa hanay na tatlo hanggang 30 mga frame bawat segundo.

Ayon sa whitepaper na kasama ng Stable Video Diffusion, sinanay ang SVD at SVD-XT sa isang dataset na may kasamang milyun-milyong video. Kasama sa proseso ng pagsasanay ang pag-fine-tune ng mga modelo sa isang mas maliit na hanay ng daan-daang libo hanggang isang milyong clip. Ang pinagmulan ng mga video ng pagsasanay na ito ay nananatiling hindi malinaw, gayundin ang pagsasama ng anumang naka-copyright na nilalaman. Ang Stability AI at ang mga user ng Stable Video Diffusion ay posibleng humarap sa mga legal at etikal na hamon kung ginamit ang naka-copyright na materyal nang walang pahintulot.

Sa kabila ng mga limitasyon nito, na kinabibilangan ng kawalan ng kakayahang bumuo ng mga video nang walang paggalaw o mabagal na mga pans ng camera, mag-render ng text nang malinaw, o patuloy na makagawa ng mga tumpak na paglalarawan ng mga mukha at tao, ang Stability AI ay optimistiko tungkol sa pagpapalawak ng mga modelo. Sinabi nila na ang mga modelo ay maaaring iakma para sa mga kaso ng paggamit tulad ng pagbuo ng 360-degree na view ng mga bagay.

Ang Stability AI ay may ambisyosong mga plano para sa hinaharap ng Stable Video Diffusion. Nagsusumikap sila sa pagbuo ng isang hanay ng mga modelo na bubuo at magpapalawak ng mga kakayahan ng SVD at SVD-XT. Bukod pa rito, gumagawa sila ng web-based na "text-to-video" na tool na magbibigay-daan sa mga user na i-prompt ang mga modelo gamit ang text. Ang pangunahing layunin ay komersyalisasyon, na may mga potensyal na aplikasyon sa advertising, edukasyon, entertainment, at higit pa.

