Spätestens seit dem Release des KI-generierten, ikonischen Werbespots von Coca Cola vor einigen Tagen sind KI-Video-Generatoren im Gespräch.
Während viele das Video regelrecht bashen (billig, zu unmenschlich), finden wir diesen Schritt ziemlich cool und mutig. (Eine neutrale Zusammenfassung dazu kannst du bei The Decoder nachlesen.)
Schau ihn dir gerne noch einmal an! ⬇️
Zunächst einmal wollen wir zwischen den unterschiedlichen Arten von KI-Videogeneratoren unterscheiden. Zu den zwei Haupttypen nach unserem Dafürhalten gehören für den Moment:
- Text-zu-Video
- KI-Avatare und Personalisierung
- Video-Editing
💡Wichtig ist für uns immer die Möglichkeit, die KI-Video-Generatoren in Automatisierungen einzubauen.
Text-zu-Video
Unter Text-zu-Video fällt alles, wofür du einen Prompt eingibst und dann ein komplettes Video generiert bekommst. Dabei kann dann alles herauskommen, je nachdem welches Tool du nutzt. Das ist mit Sicherheit die größte Gruppe.
Bekannte Vertreter dafür sind:
Ganz ehrlich: Die Ergebnisse hauen uns immer noch absolut vom Hocker! Natürlich gibt es auch bei diesen Tools (wie auch bei KI-Bildern, das kennst du sicherlich) Artefakte und „Fehler“: Aber hey. Da ist etwas großes im Gange und beim Coca-Cola Spot siehst du, dass es mittlerweile eine richtig gute Qualität hat!
KI-Avatare und Personalisierung
KI-Avatare spielen für viele Anwendungen eine Rolle: Du kannst dich selbst klonen (inkl. Stimme, dafür nutzen wir allerdings Elevenlabs…), sprichst plötzlich unterschiedliche Sprachen und kannst Schulungsvideos, personalisierte Onboarding-Nachrichten oder Social-Media-Contentmarketing machen.
Die bekanntesten Tools sind:
Besonders spannend ist hierbei, dass diese beiden Tools komplett automatisieren kannst!
Video-Editing
Ein großes Problem für viele Anwender:innen, die ihren Content automatisieren wollen, ist nicht die Generierung von Inhalten sondern die Bearbeitung!
Wir wissen, dass beispielsweise HeyGen hier einiges in Arbeit hat (ob das allerdings über die API ansteuerbar sein wird können wir nicht sagen).
Unser favorisiertes Tool zur Bearbeitung ist aktuell Creatomate! Creatomate hat sich auf API-Anbindungen spezialisiert. Du kannst Templates erstellen, automatisch Captions hinufügen und so automatisiert Videos zusammenschneiden.
Auch spannend: Creatomate ermöglicht dadurch auch Mass-Customization und eine Erstellung bspw. über Google Sheets.
Testen kannst du Creatomate kostenlos mit 50 Credits, erfahrungsgemäß können wir dir aber sagen, dass du damit wahrscheinlich nicht sonderlich weit kommst.
KI-Video-Generatoren im Detail
Jetzt geht’s ans Eingemachte: Welches Tool kann was? Wir haben hier versucht so knapp und prägnant wie möglich alle wichtigen Infos zusammenzufassen.
Disclaimer: In diesem Bereich verändert sich gerade täglich etwas. Die Texte sind Stand November 2024 und ich kann leider nicht garantieren, dass das alles morgen auch noch stimmt 😉
Runway ML
In wenigen Worten: KI-Tool für kreative Videos (Profis). Highlights: Text-to-Video, Videobearbeitung (Objektentfernung, Zeitlupe), Audiobearbeitung. Preise ab 12 USD/Monat.
Hauptfunktionen
- Erstellt Videos aus Texteingaben, Bildern oder vorhandenem Videomaterial.
- Nutzt KI-Modelle wie Stable Diffusion und DALL-E für Bildgenerierung.
- Generiert realistische Videoclips mit simulierten Kamerabewegungen.
- Unterstützt verschiedene Videoformate, einschließlich 4K-Auflösung.
Videobearbeitung
- Entfernung von Hintergründen und Objekten aus Videos.
- Anwendung von künstlicher Zeitlupe.
- Erstellung objektbezogener Kamerafahrten.
- Stil- und Texturanpassungen mittels Neural Style Transfer.
Audiobearbeitung
- Entfernung von Hintergrundgeräuschen.
- Automatische Untertitelerstellung und Transkription.
Preismodell
- Einfache Anmeldung mit Google
- Kostenlose Version mit eingeschränkten Funktionen verfügbar.
- Kostenpflichtige Abonnements ab 12$ pro Monat.
- API-Nutzung 0,25$ pro 5 Sekunden Video
In diesem Beispiel hab ich innerhalb weniger Minuten (ohne Prompt!) ein Video aus Basis eines FLUX1.1 ULTRA-Bildes erstellen können (mehr zu FLUX habe ich ich in diesem Artikel geschrieben). Ohne Prompt war hier jetzt ein bisschen problematisch: Der Hai sitzt plötzlich auf einem Fahrrad anstatt einem E-Scooter. Die Qualität ist aber trotzdem beeindruckend!
Kling AI
In wenigen Worten: Videogenerierung mit KI und Community-Gedanken, Text- und Bildbasierte Videogenerierung mit LipSync und Motion Brush. Kostenlose Credits täglich, Abos starten bei 0 USD.
Hauptfunktionen
- Erstellt Videos aus Text, Bildern oder vorhandenem Videomaterial
- Unterstützt verschiedene Videoformate (16:9, 4:3, 9:16, 3:4, 1:1)
- Generiert Videos in 1080p HD-Auflösung
Weitere Funktionen
- LipSync: Synchronisiert Lippenbewegungen mit gesprochenem Text
- Motion Brush: Ermöglicht präzise Steuerung von Bewegungen einzelner Elemente
- Custom Models: Erlaubt das Training eigener Videocharaktere für konsistente Darstellung
- Verbesserte Bildqualität, Dynamik und Prompt-Relevanz in Version 1.5
- Fähigkeit zur Generierung komplexer Szenen mit verschiedenen Kameraperspektiven
Preismodell
- Webbasierte Plattform, auch als iPhone-App verfügbar
- Monatliche kostenlosen Credits, bei LogIn
- Abo ab 10$ / Monat (aktuell Angebot)
- Einbindung bei Make möglich (ist etwas komplizierter, Sven hat ein umfassendes Video dazu gemacht)
Bei Kling musste ich 36 Minuten auf ein Ergebnis warten aber hey – es ist ja auch kostenlos! Hier habe ich ein bisschen Prompt hinzugefügt (E-Scooter, busy Streets) und auch hier finde ich das Ergebnis echt cool! Spannend finde ich, dass das Kleid zu einer Schürze wurde. Aber gut, das ist anders auch wirklich schwer vorzustellen.
Luma Dream Machine
In wenigen Worten: Kreative Visuals für alle Anwendungen (für Profis geeignet), Text-/Bildbasierte HD-Videoerstellung (schnell & skalierbar). Training auf echten Szenen. Kostenlos, API ab 0,32 USD/Million Pixel.
Hauptfunktionen
- Generiert Videos aus Texteingaben oder Bildern
- Erzeugt 5-Sekunden-Videos in HD-Qualität (720p)
- Unterstützt verschiedene Videoformate und Seitenverhältnisse
- Ermöglicht die Integration von Kamerabewegungen
Leistung und Geschwindigkeit
- Version 1.6 generiert Videos in weniger als 20 Sekunden, eine zehnfache Beschleunigung gegenüber der Vorgängerversion
- Basiert auf einer skalierbaren, effizienten und multimodalen Transformer-Architektur
Technologie
- Trainiert direkt auf Videos für physikalisch genaue und konsistente Szenen
- Versteht Interaktionen zwischen Menschen, Tieren und Objekten in der physischen Welt
Preismodell
- Webbasierte Plattform, einfache Anmeldung mit Google-Account
- Kostenlose Nutzung mit eingeschränkten Funktionen möglich (leider mit Warteliste)
- „Normale“ Pläne ab 7USD / Monat
- API für Entwickler verfügbar (0,32 US-Dollar pro Million generierter Pixel)
- Einbindung bei make möglich, allerdings nicht über ein Modul
Da ich hier nicht über die API sondern direkt teste, habe ich leider kein Video für dich. Ich stehe noch auf der Warteliste… 🦈🛵🎀
Leonardo AI
In wenigen Worten: Kreative KI-Suite – unter anderem für Videos, ideal für Produktvisualisierungen, Spiele und mehr. Preise ab 9 USD/Monat.
Hauptfunktionen
- Erstellung von 3D-Szenen aus Fotos oder Videos mit Hilfe von KI
- Erfassung von Objekten, Landschaften und Momenten in spektakulärer 3D-Qualität
- Teilen von 3D-Inhalten über das Web, iOS und Android
Technische Details
- Unterstützt iPhone 11 oder neuer für AR-Aufnahmen
- Generiert Videos in 1080p HD-Auflösung
- Exportiert NeRFs und Gaussian Splats für 3D-Engines wie Unreal und Unity
Anwendungsbereiche
- Erstellung von cinematischen Produktvideos
- Einbettung realistischer 3D-Produktdarstellungen auf Websites
- Generierung von 3D-Mesh-Assets für Spiele und andere 3D-Anwendungen
Preismodell
- Einfache Anmeldung über Google-Account
- Keine kostenlose Nutzung von „motion“
- Sowohl die API als auch die Suite kannst du ab 9 USD / Monat nutzen
- Direkt über Modul in make.com einbindbar
Die Videogenerierung kannst du bei Leonardo leider nicht kostenlos testen. Entsprechend habe ich auch hier kein Beispiel. 🦈🛵🎀
Synthesia
In wenigen Worten: KI-Avatare für einfache Videogenerierung in 140+ Sprachen. Nutzerfreundlich, ab 16 €/Monat.
Videogenerierung
- Erstellt Videos mit KI-Avataren und Sprachausgabe in über 140 Sprachen (Basis: Text)
- Generiert Videos in wenigen Minuten, ähnlich einfach wie das Erstellen einer Präsentation
- Coole Templates verfügbar
Avatare und Stimmen
- Bietet eine Vielzahl von KI-Avataren zur Auswahl
- Unterstützt mehrsprachige Stimmen in hoher Qualität
- Ermöglicht einfaches Hinzufügen von Sprachausgaben
Benutzerfreundlichkeit
- Intuitive Benutzeroberfläche mit Video-Editor
- Vorgefertigte Videovorlagen für verschiedene Anwendungsfälle
- Keine Vorkenntnisse in Videobearbeitung erforderlich
Preise
- Kostenloser Plan verfügbar
- Das günstigste Abo beginnt bei 16€/Monat
- API-Nutzung erst ab der Stufe Creator für 58€/Monat
- Einbindung bei make.com direkt über ein Modul möglich
HeyGen
In wenigen Worten: KI-Avatar-basierte Videogenerierung, inkl. Text-to-Speech und Voice Cloning. Preise ab 29 USD/Monat.
Videogenerierung
- Wandelt Text in professionelle Videos mit KI-Avataren um (schnell)
- Unterstützt verschiedene Videoformate und Auflösungen, einschließlich 4K
- Bietet Funktionen wie Lippensynchronisation und Übersetzung in andere Sprachen
- Coole Templates verfügbar
Avatare und Stimmen
- Über 100 vorgefertigte KI-Avatare zur Auswahl
- Erstellung eigener Avatare durch Foto-Upload oder Video
- Text-to-Speech-Funktion mit synthetischen Stimmen in verschiedenen Sprachen und Akzenten
- Voice Cloning zur Erstellung einer synthetischen Version der eigenen Stimme (wir nutzen hier allerdings aktuell Elevenlabs)
Benutzerfreundlichkeit
- Intuitive Benutzeroberfläche mit schrittweiser Anleitung zur Avatar-Erstellung
- Einfache Texteingabe für die Sprachausgabe des Avatars
- Vorschau-Funktion zur Überprüfung des Endergebnisses vor dem Export
- Integration mit anderen Plattformen wie Canva möglich
Preise
- Kostenloser Plan verfügbar
- Das günstigste Abo beginnt bei 29USD/Monat
- API-Pläne haben ein anderes Pricing
- Einbindung bei make.com direkt über ein Modul möglich, wir haben zusätzlich eine Extra-API, die wir zur Einbindung nutzen können
Creatomate
Welcher KI-Video-Generator ist am besten?
Mal wieder: Ein klares kommt darauf an!
KI-Video-Generatoren verändert die Videoproduktion gerade radikal. Videos zu erstellen wird plötzlich einfach und ist nicht mehr den Profis vorbehalten.
Für den einen ist es eine Spielerei, die einfach nur Faszination ausübt – dann ist beispielsweise KLING super geeignet. Für andere ist es das täglich Brot und verändert die Art und Weise, wie die Kreativbranche, Marketing, Kundeninteraktion und so vieles mehr funktioniert.
Mit Funktionen wie Text-to-Video, 3D-Szenen, Lippensynchronisation und automatischer Audiobearbeitung sparst du Zeit und Geld (und hast plötzlich Zugang zu ganz neuen Möglichkeiten). Wer kann schon von sich behaupten, dass er ohne KI richtig gute Videos filmen (oder sogar rendern) könnte! Ich jedenfalls nicht.
Bei den KI-Avataren geben sich HeyGen und Synthesia nach unserem Dafürhalten wenig. Wir beobachten und nutzen allerdings HeyGen genauer und finden, dass sich das Unternehmen und die Funktionen sehr positiv entwickeln.
Die meisten Tools kannst du kostenlos testen (am niederschwelligsten sind Runway und Kling, Synthesia und HeyGen geben sich nichts).
Und auch wenn aus nur aus Neugierde ist: es lohnt sich!
Zum Abschluss kannst du dir gerne noch das folgende Video ansehen, in dem dir Sven zeigt, wie er automatisiert mit make.com und Kling AI ein Video generiert!