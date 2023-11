Stability AI, en lovende AI-oppstart, har avduket et banebrytende produkt kalt Stable Video Diffusion. Denne AI-modellen har muligheten til å transformere eksisterende bilder til videoer ved å animere dem, og den er en av få videogenererende modeller som er tilgjengelige for bruk med åpen kildekode. Lanseringen av Stable Video Diffusion kommer på et tidspunkt da kaoset hos OpenAI dominerer overskriftene, og viser Stability AIs motstandskraft og fokus på produktveikartet deres.

Stabil videospredning er for øyeblikket i en "forhåndsvisning"-fase, der interesserte brukere må godta spesifikke bruksvilkår. Disse vilkårene skisserer de tiltenkte bruksområdene til Stable Video Diffusion, for eksempel pedagogiske og kreative verktøy, samt design og andre kunstneriske prosesser. Det er imidlertid viktig å merke seg at faktiske eller sanne representasjoner av mennesker eller hendelser ikke er blant de tiltenkte bruksområdene.

Selv om denne innovasjonen fra Stability AI har et enormt potensial, er det bekymringer for potensiell misbruk. Tatt i betraktning historien til lignende AI-forskningsforhåndsvisninger, inkludert Stability AIs tidligere utgivelser, er det en mulighet for at modellen kan utnyttes på det mørke nettet. For å motvirke dette er det avgjørende for Stable Video Diffusion å ha et innebygd innholdsfilter for å forhindre misbruk. Den forrige utgivelsen av Stability AIs modell, Stable Diffusion, ble misbrukt til å lage dypt falskt vokseninnhold uten samtykke, og understreket viktigheten av innholdsregulering.

Stable Video Diffusion består av to modeller, nemlig SVD og SVD-XT. SVD kan forvandle stillbilder til 576×1024 videoer med 14 bilder, mens SVD-XT øker bildene til 24. Begge modellene har muligheten til å generere videoer med en rekkevidde på tre til 30 bilder per sekund.

I følge hvitboken som følger med Stable Video Diffusion, ble SVD og SVD-XT trent på et datasett som inkluderte millioner av videoer. Opplæringsprosessen innebar å finjustere modellene på et mindre sett på hundretusener til én million klipp. Opprinnelsen til disse treningsvideoene er fortsatt uklar, og det samme gjør inkluderingen av opphavsrettsbeskyttet innhold. Stability AI og brukerne av Stable Video Diffusion kan potensielt møte juridiske og etiske utfordringer hvis opphavsrettsbeskyttet materiale ble brukt uten tillatelse.

Til tross for begrensningene, som inkluderer manglende evne til å generere videoer uten bevegelse eller sakte kamerapanoreringer, gjengi tekst leselig eller konsekvent produsere nøyaktige avbildninger av ansikter og mennesker, er Stability AI optimistisk med tanke på utvidbarheten til modellene. De har uttalt at modellene kan tilpasses for brukstilfeller som å generere 360-graders visninger av objekter.

Stability AI har ambisiøse planer for fremtiden til Stable Video Diffusion. De jobber med å utvikle en rekke modeller som vil bygge videre på og utvide mulighetene til SVD og SVD-XT. I tillegg utvikler de et nettbasert "tekst-til-video"-verktøy som lar brukere spørre modellene med tekst. Det endelige målet er kommersialisering, med potensielle bruksområder innen reklame, utdanning, underholdning og mer.

