Alibaba vừa ra mắt Wan2.2-S2V, một mô hình chuyển đổi giọng nói thành video với 14B tham số.
Chuyển đổi âm thanh thành các đoạn phim chất lượng điện ảnh với chuyển động và điều khiển môi trường sống động. Và nó hoàn toàn mã nguồn mở.
Ví dụ bên dưới: (âm thanh trên)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Ok... điều này thật điên rồ!
Alibaba vừa ra mắt Wan2.2-S2V, một mô hình chuyển đổi giọng nói thành video với 14B tham số.
Chuyển đổi âm thanh thành các đoạn phim chất lượng điện ảnh với chuyển động và điều khiển môi trường sống động. Và nó hoàn toàn mã nguồn mở.
Ví dụ bên dưới: (âm thanh trên)