Stability AI, een veelbelovende AI-startup, heeft een baanbrekend product onthuld genaamd Stable Video Diffusion. Dit AI-model heeft de mogelijkheid om bestaande afbeeldingen om te zetten in video's door ze te animeren, en het is een van de weinige video-genererende modellen die beschikbaar zijn voor open-sourcegebruik. De lancering van Stable Video Diffusion komt op een moment dat de chaos bij OpenAI de krantenkoppen domineert, wat de veerkracht van Stability AI en de focus op hun productroadmap laat zien.

Stable Video Diffusion bevindt zich momenteel in een 'onderzoekspreview'-fase, waarin geïnteresseerde gebruikers akkoord moeten gaan met specifieke gebruiksvoorwaarden. Deze termen schetsen de beoogde toepassingen van Stable Video Diffusion, zoals educatieve en creatieve hulpmiddelen, evenals ontwerp- en andere artistieke processen. Het is echter belangrijk op te merken dat feitelijke of waarheidsgetrouwe weergaven van mensen of gebeurtenissen niet tot de beoogde toepassingen behoren.

Hoewel deze innovatie van Stability AI een enorm potentieel heeft, zijn er zorgen over het mogelijke misbruik ervan. Gezien de geschiedenis van soortgelijke AI-onderzoekspreviews, inclusief de eerdere releases van Stability AI, bestaat de mogelijkheid dat het model op het dark web kan worden uitgebuit. Om dit tegen te gaan is het voor Stable Video Diffusion van cruciaal belang om een ​​ingebouwd inhoudsfilter te hebben om misbruik te voorkomen. De vorige release van het Stability AI-model, Stable Diffusion, werd misbruikt om niet-consensuele deepfake-inhoud voor volwassenen te creëren, wat het belang van inhoudregulering benadrukte.

Stabiele videodiffusie bestaat uit twee modellen, namelijk SVD en SVD-XT. SVD kan stilstaande beelden omzetten in video's van 576 x 1024 met 14 frames, terwijl SVD-XT het aantal frames vergroot tot 24. Beide modellen hebben de mogelijkheid om video's te genereren met een bereik van drie tot 30 frames per seconde.

Volgens de whitepaper bij Stable Video Diffusion zijn SVD en SVD-XT getraind op een dataset die miljoenen video's bevatte. Het trainingsproces omvatte het verfijnen van de modellen op een kleinere set van honderdduizenden tot een miljoen clips. De oorsprong van deze trainingsvideo's blijft onduidelijk, evenals de opname van auteursrechtelijk beschermde inhoud. Stability AI en de gebruikers van Stable Video Diffusion zouden mogelijk te maken kunnen krijgen met juridische en ethische uitdagingen als auteursrechtelijk beschermd materiaal zonder toestemming zou worden gebruikt.

Ondanks de beperkingen, waaronder het onvermogen om video's te genereren zonder beweging of langzame camerabewegingen, tekst leesbaar weer te geven of consistent nauwkeurige afbeeldingen van gezichten en mensen te produceren, is Stability AI optimistisch over de uitbreidbaarheid van de modellen. Ze hebben verklaard dat de modellen kunnen worden aangepast voor gebruiksscenario's zoals het genereren van 360 graden weergaven van objecten.

Stability AI heeft ambitieuze plannen voor de toekomst van Stable Video Diffusion. Ze werken aan de ontwikkeling van een reeks modellen die voortbouwen op de mogelijkheden van SVD en SVD-XT en deze uitbreiden. Daarnaast ontwikkelen ze een webgebaseerde ‘tekst-naar-video’-tool waarmee gebruikers de modellen kunnen voorzien van tekst. Het uiteindelijke doel is commercialisering, met mogelijke toepassingen in reclame, onderwijs, amusement en daarbuiten.

