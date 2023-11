Stability AI, en lovende AI-startup, har afsløret et banebrydende produkt kaldet Stable Video Diffusion. Denne AI-model har evnen til at omdanne eksisterende billeder til videoer ved at animere dem, og den er en af ​​de få videogenererende modeller, der er tilgængelige til open source-brug. Lanceringen af ​​Stable Video Diffusion kommer på et tidspunkt, hvor kaosset hos OpenAI dominerer overskrifterne og viser Stability AI's modstandsdygtighed og fokus på deres produktkøreplan.

Stable Video Diffusion er i øjeblikket i et "research preview"-stadium, hvor interesserede brugere skal acceptere specifikke brugsbetingelser. Disse vilkår beskriver de tilsigtede anvendelser af Stable Video Diffusion, såsom uddannelsesmæssige og kreative værktøjer, samt design og andre kunstneriske processer. Det er dog vigtigt at bemærke, at faktuelle eller sande repræsentationer af mennesker eller begivenheder ikke er blandt de tilsigtede anvendelser.

Selvom denne innovation fra Stability AI rummer et enormt potentiale, er der bekymring for dens potentielle misbrug. I betragtning af historien om lignende AI-forskningseksempler, inklusive Stability AI's tidligere udgivelser, er der en mulighed for, at modellen kan udnyttes på det mørke web. For at modvirke dette er det afgørende for Stable Video Diffusion at have et indbygget indholdsfilter for at forhindre misbrug. Den tidligere udgivelse af Stability AI's model, Stable Diffusion, blev misbrugt til at skabe deepfake voksenindhold uden samtykke, hvilket understreger vigtigheden af ​​indholdsregulering.

Stable Video Diffusion består af to modeller, nemlig SVD og SVD-XT. SVD kan omdanne stillbilleder til 576×1024 videoer med 14 billeder, mens SVD-XT øger billederne til 24. Begge modeller har mulighed for at generere videoer med en rækkevidde på tre til 30 billeder i sekundet.

Ifølge hvidbogen, der ledsager Stable Video Diffusion, blev SVD og SVD-XT trænet på et datasæt, der omfattede millioner af videoer. Træningsprocessen involverede finjustering af modellerne på et mindre sæt af hundredtusindvis til en million klip. Oprindelsen af ​​disse træningsvideoer er stadig uklar, og det samme gør medtagelsen af ​​ophavsretligt beskyttet indhold. Stabilitets AI og brugerne af Stable Video Diffusion kan potentielt stå over for juridiske og etiske udfordringer, hvis ophavsretligt beskyttet materiale blev brugt uden tilladelse.

På trods af dets begrænsninger, som inkluderer manglende evne til at generere videoer uden bevægelse eller langsomme kamerapanoreringer, gengive tekst læseligt eller konsekvent producere nøjagtige afbildninger af ansigter og mennesker, er Stability AI optimistisk med hensyn til modellernes udvidelsesmuligheder. De har udtalt, at modellerne kan tilpasses til brugstilfælde som at generere 360-graders visninger af objekter.

Stability AI har ambitiøse planer for fremtiden for Stable Video Diffusion. De arbejder på at udvikle en række modeller, der vil bygge videre på og udvide mulighederne for SVD og SVD-XT. Derudover er de ved at udvikle et webbaseret "tekst-til-video"-værktøj, der giver brugerne mulighed for at bede modellerne med tekst. Det ultimative mål er kommercialisering med potentielle anvendelser inden for reklame, uddannelse, underholdning og mere.

