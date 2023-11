By

A Stability AI, egy ígéretes AI startup bemutatta a Stable Video Diffusion nevű, úttörő terméket. Ez a mesterséges intelligencia modell képes a meglévő képeket videókká alakítani animálással, és egyike azon kevés videógeneráló modelleknek, amelyek nyílt forráskódú használatra is elérhetők. A Stable Video Diffusion bevezetése akkor történik, amikor az OpenAI káosz uralja a híreket, bemutatva a Stabilitási mesterséges intelligencia rugalmasságát, és a termékük ütemtervére összpontosítva.

A Stable Video Diffusion jelenleg a „kutatási előzetes” szakaszban van, ahol az érdeklődő felhasználóknak el kell fogadniuk a konkrét használati feltételeket. Ezek a kifejezések felvázolják a Stable Video Diffusion tervezett alkalmazásait, például oktatási és kreatív eszközöket, valamint tervezést és egyéb művészi folyamatokat. Fontos azonban megjegyezni, hogy az emberek vagy események tényszerű vagy valós ábrázolása nem tartozik a tervezett felhasználások közé.

Bár a Stabilitási mesterséges intelligencia ezen újítása hatalmas lehetőségeket rejt magában, aggodalomra ad okot az esetleges visszaélések. Figyelembe véve a hasonló mesterségesintelligencia-kutatások történetét, beleértve a Stability AI korábbi kiadásait is, fennáll annak a lehetősége, hogy a modellt a sötét weben is kihasználják. Ennek ellensúlyozására elengedhetetlen, hogy a Stable Video Diffusion beépített tartalomszűrővel rendelkezzen a visszaélések megelőzésére. A Stability AI modelljének korábbi kiadását, a Stable Diffusion-t nem konszenzusos, mélyhamisított, felnőtteknek szánt tartalom létrehozására használták fel, ezzel is hangsúlyozva a tartalomszabályozás fontosságát.

A Stable Video Diffusion két modellből áll, mégpedig az SVD-ből és az SVD-XT-ből. Az SVD képes az állóképeket 576×1024-es 14 képkockás videókká alakítani, míg az SVD-XT 24-re növeli a képkockákat. Mindkét modell képes 30-XNUMX képkocka/másodperc közötti videofelvételek készítésére.

A Stable Video Diffusion-t kísérő tanulmány szerint az SVD-t és az SVD-XT-t egy több millió videót tartalmazó adatkészletre képezték ki. A képzési folyamat a modellek finomhangolását jelentette egy kisebb, több százezer-egymillió klipkészleten. Ezen oktatóvideók eredete továbbra is tisztázatlan, csakúgy, mint a szerzői joggal védett tartalom szerepeltetése. A Stability AI és a Stable Video Diffusion felhasználói jogi és etikai kihívásokkal szembesülhetnek, ha szerzői joggal védett anyagokat engedély nélkül használnak fel.

A korlátai ellenére, amelyek közé tartozik, hogy nem lehet videókat generálni mozgás nélkül, vagy lassú a kamera pásztázása, nem lehet olvashatóan megjeleníteni a szöveget, vagy következetesen pontos arc- és emberábrázolást készíteni, a Stability AI optimista a modellek bővíthetőségét illetően. Kijelentették, hogy a modellek adaptálhatók olyan használati esetekre, mint például az objektumok 360 fokos nézeteinek létrehozása.

A Stability AI ambiciózus tervei vannak a Stable Video Diffusion jövőjét illetően. Olyan modellek kifejlesztésén dolgoznak, amelyek az SVD és az SVD-XT képességeire építenek, és kibővítik azokat. Ezenkívül egy webalapú „szöveg-videó” eszközt fejlesztenek, amely lehetővé teszi a felhasználók számára, hogy szöveggel jelezzék a modelleket. A végső cél a kommercializáció, potenciális alkalmazásokkal a reklámozásban, az oktatásban, a szórakoztatásban és azon túl.

