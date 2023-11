Stability AI, unha prometedora startup de IA, presentou un produto innovador chamado Stable Video Diffusion. Este modelo de IA ten a capacidade de transformar imaxes existentes en vídeos mediante a súa animación, e é un dos poucos modelos de xeración de vídeos dispoñibles para o seu uso en código aberto. O lanzamento de Stable Video Diffusion chega nun momento no que o caos en OpenAI domina os titulares, mostrando a resistencia de Stability AI e o foco na súa folla de ruta de produtos.

Stable Video Diffusion atópase actualmente nunha fase de "vista previa de investigación", onde os usuarios interesados ​​deben aceptar condicións específicas de uso. Estes termos describen as aplicacións previstas de Stable Video Diffusion, como as ferramentas educativas e creativas, así como o deseño e outros procesos artísticos. Non obstante, é importante ter en conta que as representacións fácticas ou verdadeiras de persoas ou eventos non están entre os usos previstos.

Aínda que esta innovación de Stability AI ten un potencial inmenso, hai preocupacións polo seu posible uso indebido. Tendo en conta o historial de vista previa de investigacións de IA similares, incluídas as versións anteriores de Stability AI, existe a posibilidade de que o modelo poida ser explotado na web escura. Para contrarrestar isto, é fundamental que Stable Video Diffusion teña un filtro de contido integrado para evitar o abuso. A versión anterior do modelo de Stability AI, Stable Diffusion, utilizouse indebidamente para crear contido para adultos deepfake non consensuado, destacando a importancia da regulación do contido.

Stable Video Diffusion consta de dous modelos, a saber SVD e SVD-XT. SVD pode transformar imaxes fixas en vídeos de 576 × 1024 con 14 fotogramas, mentres que SVD-XT aumenta os fotogramas a 24. Ambos os modelos teñen a capacidade de xerar vídeos a un rango de tres a 30 fotogramas por segundo.

Segundo o libro branco que acompaña a Stable Video Diffusion, SVD e SVD-XT foron adestrados nun conxunto de datos que incluía millóns de vídeos. O proceso de adestramento implicou afinar os modelos nun conxunto máis pequeno de centos de miles a un millón de clips. A orixe destes vídeos de formación segue sen estar clara, así como a inclusión de calquera contido protexido por copyright. Stability AI e os usuarios de Stable Video Diffusion poderían enfrontarse a desafíos legais e éticos se se utilizase material protexido por copyright sen permiso.

A pesar das súas limitacións, que inclúen a incapacidade de xerar vídeos sen movemento ou panorámicas lentas da cámara, renderizar o texto de forma lexible ou producir de forma consistente representacións precisas de rostros e persoas, Stability AI é optimista sobre a extensibilidade dos modelos. Afirmaron que os modelos poden adaptarse para casos de uso como a xeración de vistas de 360 ​​graos de obxectos.

Stability AI ten plans ambiciosos para o futuro de Stable Video Diffusion. Están traballando no desenvolvemento dunha gama de modelos que se basearán e ampliarán as capacidades de SVD e SVD-XT. Ademais, están a desenvolver unha ferramenta de "texto a vídeo" baseada na web que permitirá aos usuarios solicitar os modelos con texto. O obxectivo final é a comercialización, con posibles aplicacións en publicidade, educación, entretemento e máis alá.

