DiscoverWavesCommunities

阿里开源视频生成模型2VGen-XL

阿里开源视频生成模型2VGen-XL

Published in

Words

0

Reading

0 min

Listen

Play

2023-12-19 06:18

阿里开源视频生成模型2VGen-XL

阿里之前11月发布了论文要开源的I2VGen-XL图像生成视频模型，终于发布了具体的代码和模型。演示里面没有人物大幅动作的视频。

I2VGen-XL包括两个阶段：
i) 基础阶段通过使用两个分层编码器保证连贯的语义，并保留输入图像的内容，
ii) 优化阶段通过整合额外的简短文本来增强视频的细节，并将分辨率提高到1280x720。

收集了约3500万个单镜头文本视频对和60亿个文本图像对来优化模型。通过这种方式，I2VGen-XL可以同时提高生成视频的语义准确性、细节的连续性和清晰度。

2023-12-19 06:18

This post was published via exxp. Ecency is not the originator or editor of this content and displays it for discovery purposes only.

$ 0.000

0

Read next

AI工具更新 / ai #48

AI工具更新 / ai #48

lemooljiang2026-03-27 12:21

3D打印又达成一项成就

3D打印又达成一项成就

yellowbird2026-05-14 03:46

加油，国产大模型

加油，国产大模型

rivalhw2026-04-10 02:45