
KI-Videomodell der nächsten Generation mit Multi-Shot-Storytelling, 720p-Ausgabe und persistenter Charakteridentität von ByteDance.
Seedance 2.0 basiert auf ByteDances einheitlicher multimodaler Audio-Video-Architektur. Die offizielle Modelldokumentation listet Text-, Bild-, Video- und Audio-Referenzunterstützung mit nativer 480p- und 720p-Ausgabe von 4 bis 15 Sekunden auf. Dieser Web-Generator stellt die Kern-Text-zu-Video- und Bild-zu-Video-Workflows mit nativen Audio-, Auflösungs-, Dauer- und Seitenverhältnissteuerungen bereit.
Wichtige Spezifikationen des Seedance 2.0-Modells.
Maximale Auflösung
Sound mit Video
Maximale Dauer
Beschreiben Sie die Szene in natürlicher Sprache oder wechseln Sie zu Bild-zu-Video und laden Sie ein Startbild zum Animieren hoch.
Wählen Sie 480p oder 720p, stellen Sie die Dauer von 4 bis 15 Sekunden ein, wählen Sie ein Seitenverhältnis und aktivieren oder deaktivieren Sie nativen Sound.
Seedance 2.0 verarbeitet den Prompt und die Referenzen und gibt dann einen synchronisierten Audio-Video-Clip zurück. Die Kreditkosten hängen von Auflösung, Dauer und Text-zu-Video- versus Bild-zu-Video-Modus ab.
Audio und Video werden zusammen generiert, nicht als separater Synchronisationsschritt. Dialog, Soundeffekte, Musik und Umgebungsgeräusche können mit den Visuals synchronisiert werden.
Dolly-Zooms, Rack-Fokus, Tracking-Shots, POV-Wechsel und sanfte Handkamera-Bewegungen können direkt im Prompt beschrieben werden.
ByteDance hat physikbewusstes Training integriert, das unmögliche Bewegungen während der Generierung bestraft. Stoff fällt und knittert natürlich, Wasser spritzt mit korrektem Gewicht, Kollisionen haben Auswirkungen und Charaktere verlagern ihr Gleichgewicht beim Gehen.
Verwenden Sie den Bild-zu-Video-Modus, um das Aussehen eines Startbildes beizubehalten, während Sie Kamerabewegung, Objektbewegung und Umgebungsaktion hinzufügen.
16:9, 9:16, 1:1, 4:3, 3:4 und 21:9. Diese decken horizontale Videos, vertikale Social-Formate, quadratische Feeds, Porträts und Ultrawide-Szenen ab.
Ein 5-Sekunden-Seedance 2.0-Text-zu-Video beginnt bei 20 Credits in 480p und 45 Credits in 720p. Bild-zu-Video kostet mehr, da es auf einem Referenzbild basiert.
Text-zu-Video, Bild-zu-Video, physikbewusste Bewegung und native Audio-Beispiele, generiert von Seedance-Modellen.






Text-zu-Video und Bild-zu-Video mit 480p/720p-Ausgabe, nativem Audio und bis zu 15 Sekunden Dauer.