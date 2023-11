Stability AI, una promettente startup AI, ha presentato un prodotto rivoluzionario chiamato Stable Video Diffusion. Questo modello di intelligenza artificiale ha la capacità di trasformare le immagini esistenti in video animandole ed è uno dei pochi modelli di generazione video disponibili per l'uso open source. Il lancio di Stable Video Diffusion arriva in un momento in cui il caos di OpenAI domina i titoli dei giornali, dimostrando la resilienza di Stability AI e l'attenzione sulla roadmap del prodotto.

Stable Video Diffusion è attualmente in una fase di "anteprima della ricerca", in cui gli utenti interessati devono accettare termini di utilizzo specifici. Questi termini delineano le applicazioni previste di Stable Video Diffusion, come strumenti educativi e creativi, nonché design e altri processi artistici. Tuttavia, è importante notare che le rappresentazioni fattuali o reali di persone o eventi non rientrano tra gli usi previsti.

Sebbene questa innovazione di Stability AI abbia un potenziale immenso, ci sono preoccupazioni riguardo al suo potenziale uso improprio. Considerando la storia di simili anteprime di ricerche sull’intelligenza artificiale, comprese le versioni precedenti di Stability AI, esiste la possibilità che il modello possa essere sfruttato nel dark web. Per contrastare questo problema, è fondamentale che Stable Video Diffusion disponga di un filtro dei contenuti integrato per prevenire gli abusi. La versione precedente del modello di Stability AI, Stable Diffusion, è stata utilizzata in modo improprio per creare contenuti per adulti deepfake non consensuali, evidenziando l'importanza della regolamentazione dei contenuti.

La diffusione video stabile è composta da due modelli, ovvero SVD e SVD-XT. SVD può trasformare immagini fisse in video 576×1024 con 14 fotogrammi, mentre SVD-XT aumenta i fotogrammi a 24. Entrambi i modelli hanno la capacità di generare video a una velocità compresa tra 30 e XNUMX fotogrammi al secondo.

Secondo il white paper che accompagna Stable Video Diffusion, SVD e SVD-XT sono stati addestrati su un set di dati che includeva milioni di video. Il processo di formazione prevedeva la messa a punto dei modelli su un insieme più piccolo di centinaia di migliaia o un milione di clip. L'origine di questi video di formazione rimane poco chiara, così come l'inclusione di eventuali contenuti protetti da copyright. Stability AI e gli utenti di Stable Video Diffusion potrebbero potenzialmente affrontare sfide legali ed etiche se il materiale protetto da copyright fosse utilizzato senza autorizzazione.

Nonostante i suoi limiti, che includono l’incapacità di generare video senza movimento o panoramiche lente della fotocamera, di rendere il testo in modo leggibile o di produrre in modo coerente rappresentazioni accurate di volti e persone, Stability AI è ottimista riguardo all’estensibilità dei modelli. Hanno affermato che i modelli possono essere adattati a casi d’uso come la generazione di viste a 360 gradi degli oggetti.

Stability AI ha piani ambiziosi per il futuro della Stable Video Diffusion. Stanno lavorando allo sviluppo di una gamma di modelli che si baseranno ed estenderanno le capacità di SVD e SVD-XT. Inoltre, stanno sviluppando uno strumento “da testo a video” basato sul web che consentirà agli utenti di inserire testo nei modelli. L’obiettivo finale è la commercializzazione, con potenziali applicazioni nella pubblicità, nell’istruzione, nell’intrattenimento e altro ancora.

Fonte:

– Stabilità AI: [stabilità-ai.com](https://stabilità-ai.com)

– Forbes: [forbes.com](https://www.forbes.com)