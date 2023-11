By

Stability AI, ein vielversprechendes KI-Startup, hat ein bahnbrechendes Produkt namens Stable Video Diffusion vorgestellt. Dieses KI-Modell verfügt über die Fähigkeit, vorhandene Bilder durch Animation in Videos umzuwandeln, und es ist eines der wenigen Videogenerierungsmodelle, die für die Open-Source-Nutzung verfügbar sind. Der Start von Stable Video Diffusion erfolgt zu einer Zeit, in der das Chaos bei OpenAI die Schlagzeilen dominiert, was die Widerstandsfähigkeit von Stability AI und die Konzentration auf die Produkt-Roadmap unter Beweis stellt.

Stable Video Diffusion befindet sich derzeit in der „Forschungsvorschau“-Phase, in der interessierte Benutzer bestimmten Nutzungsbedingungen zustimmen müssen. Diese Begriffe beschreiben die beabsichtigten Anwendungen von Stable Video Diffusion, wie z. B. pädagogische und kreative Werkzeuge sowie Design und andere künstlerische Prozesse. Es ist jedoch wichtig zu beachten, dass sachliche oder wahrheitsgetreue Darstellungen von Personen oder Ereignissen nicht zu den beabsichtigten Verwendungszwecken zählen.

Obwohl diese Innovation von Stability AI ein immenses Potenzial birgt, bestehen Bedenken hinsichtlich eines möglichen Missbrauchs. Angesichts der Geschichte ähnlicher KI-Forschungsvorschauen, einschließlich früherer Veröffentlichungen von Stability AI, besteht die Möglichkeit, dass das Modell im Dark Web ausgenutzt werden könnte. Um dem entgegenzuwirken, ist es für Stable Video Diffusion von entscheidender Bedeutung, über einen integrierten Inhaltsfilter zu verfügen, um Missbrauch zu verhindern. Die vorherige Version des Modells von Stability AI, Stable Diffusion, wurde missbraucht, um nicht einvernehmliche Deepfake-Inhalte für Erwachsene zu erstellen, was die Bedeutung der Inhaltsregulierung hervorhebt.

Stable Video Diffusion besteht aus zwei Modellen, nämlich SVD und SVD-XT. SVD kann Standbilder in 576×1024-Videos mit 14 Bildern umwandeln, während SVD-XT die Bilder auf 24 erhöht. Beide Modelle sind in der Lage, Videos mit einem Bereich von drei bis 30 Bildern pro Sekunde zu erzeugen.

Laut dem Whitepaper zu Stable Video Diffusion wurden SVD und SVD-XT anhand eines Datensatzes trainiert, der Millionen von Videos enthielt. Der Trainingsprozess umfasste die Feinabstimmung der Modelle anhand einer kleineren Menge von Hunderttausenden bis einer Million Clips. Der Ursprung dieser Schulungsvideos bleibt unklar, ebenso wie die Aufnahme etwaiger urheberrechtlich geschützter Inhalte. Stability AI und die Benutzer von Stable Video Diffusion könnten möglicherweise vor rechtlichen und ethischen Herausforderungen stehen, wenn urheberrechtlich geschütztes Material ohne Genehmigung verwendet würde.

Trotz seiner Einschränkungen, zu denen die Unfähigkeit gehört, Videos ohne Bewegung oder langsame Kameraschwenks zu erstellen, Text lesbar wiederzugeben oder konsistent genaue Darstellungen von Gesichtern und Personen zu erzeugen, ist Stability AI optimistisch, was die Erweiterbarkeit der Modelle angeht. Sie haben erklärt, dass die Modelle für Anwendungsfälle wie die Generierung von 360-Grad-Ansichten von Objekten angepasst werden können.

Stability AI hat ehrgeizige Pläne für die Zukunft der stabilen Videoverbreitung. Sie arbeiten an der Entwicklung einer Reihe von Modellen, die auf den Fähigkeiten von SVD und SVD-XT aufbauen und diese erweitern. Darüber hinaus entwickeln sie ein webbasiertes „Text-to-Video“-Tool, mit dem Benutzer die Modelle mit Text auffordern können. Das ultimative Ziel ist die Kommerzialisierung mit potenziellen Anwendungen in Werbung, Bildung, Unterhaltung und darüber hinaus.

Quellen:

– Stabilitäts-KI: [stability-ai.com](https://stability-ai.com)

– Forbes: [forbes.com](https://www.forbes.com)