发布时期:2025-02-22
属地:上海市
模型名称:通义万相
备案单位:上海魔搭科技有限公司
备案号:Shanghai-TongYiWanXiang-202410090024
备案时间:2024/10/31
Wan2.1-T2V-14B 是一个开源的高级文本到视频生成模型,该 14B 模型在开源和闭源模型中均创造了最先进的性能基准,能够生成具有显著动态效果的高质量视觉内容。它是唯一一个能够同时生成中英文文本的视频模型,并支持 480P 和 720P 分辨率的视频生成。模型采用扩散变换器架构,并通过创新的时空变分自编码器(VAE)、可扩展的训练策略和大规模数据构建来提升生成能力