
ByteDance의 멀티샷 스토리텔링, 720p 출력, 지속적 캐릭터 아이덴티티를 갖춘 차세대 AI 비디오 모델.
Seedance 2.0은 ByteDance의 통합 멀티모달 오디오-비디오 아키텍처를 기반으로 구축되었습니다. 공식 모델 문서에는 텍스트, 이미지, 비디오, 오디오 참조 지원과 4초에서 15초까지의 네이티브 480p 및 720p 출력이 나열되어 있습니다. 이 웹 생성기는 네이티브 오디오, 해상도, 길이 및 화면 비율 컨트롤을 갖춘 핵심 텍스트-비디오 및 이미지-비디오 워크플로를 제공합니다.
Seedance 2.0 모델의 주요 사양.
최대 해상도
비디오와 사운드
최대 길이
자연어로 장면을 설명하거나 이미지-비디오로 전환하여 애니메이션화할 시작 이미지를 업로드하세요.
480p 또는 720p를 선택하고, 4초에서 15초까지 길이를 설정하고, 화면 비율을 선택하고, 네이티브 사운드를 활성화 또는 비활성화하세요.
Seedance 2.0은 프롬프트와 참조를 처리한 다음 동기화된 오디오-비디오 클립을 반환합니다. 크레딧 비용은 해상도, 길이, 텍스트-비디오 대 이미지-비디오 모드에 따라 다릅니다.
오디오와 비디오는 별도의 더빙 단계가 아닌 함께 생성됩니다. 대화, 효과음, 음악, 환경음을 비주얼과 동기화할 수 있습니다.
돌리 줌, 랙 포커스, 트래킹 샷, POV 스위치, 부드러운 핸드헬드 모션을 프롬프트에서 직접 설명할 수 있습니다.
ByteDance는 생성 중 불가능한 모션에 페널티를 부여하는 물리 인식 훈련을 통합했습니다. 천은 자연스럽게 드레이프되고 주름이 생기며, 물은 올바른 무게로 튀고, 충돌에는 충격이 있으며, 캐릭터는 걸을 때 균형을 이동합니다.
이미지-비디오 모드를 사용하여 카메라 움직임, 객체 움직임, 환경 액션을 추가하면서 시작 이미지의 룩을 보존하세요.
16:9, 9:16, 1:1, 4:3, 3:4, 21:9. 가로 비디오, 세로 소셜 형식, 정사각형 피드, 세로, 울트라와이드 장면을 다룹니다.
5초 Seedance 2.0 텍스트-비디오는 480p에서 20크레딧, 720p에서 45크레딧부터 시작합니다. 이미지-비디오는 참조 이미지를 조건으로 하기 때문에 비용이 더 많이 듭니다.
텍스트-비디오, 이미지-비디오, 물리 인식 모션, 네이티브 오디오 예시는 Seedance 모델로 생성되었습니다.





