万相

14小时前更新 5 00

阿里云推出的AI视频与图像生成模型

收录时间:
2026-04-08

万相Wan)是阿里云推出的AI视频与图像生成模型,能把文字或图片变成专业级的图像和视频。它属于阿里”通义”大模型家族的一员,跟通义千问是兄弟关系。千问负责聊天对话,万相负责视觉创作。

4月1日阿里正式发布的 万相2.7,包括Wan2.7-Image和Wan2.7-Video。

Wan2.7-Image(4月1日发布)

这是一个图像生成与编辑统一模型,针对当前AI生图中的审美疲劳、色彩失控等痛点,带来了更具”活人感”的人物生成、精准的色彩控制以及超长文本渲染能力。

几个亮点:

  • 强化了虚拟形象捏脸功能,支持从骨相、眼眸到五官细微处的全方位定制,实现”千人千面”,告别AI标准脸
  • 全新支持”调色盘”功能,用户可一键提取或输入参考图的颜色和占比,生成同色系图片,自由调控配色方案
  • 超强文字渲染能力,支持12种语言,最高3K token超长文字输入,可输出一页A4纸级别的内容,表格、数学公式、多语言混排都能稳定输出
  • 支持”精准框选编辑”,在指定区域进行元素添加、移动,实现像素级对齐;还支持最高12张组图生成

Wan2.7-Video(4月3日发布)

涵盖文生视频(Wan2.7-t2v)、图生视频(Wan2.7-i2v)、参考生视频(Wan2.7-r2v)和视频编辑(Wan2.7-videoedit)四大模型,官方口号是从”演”迈向”导”。

核心升级在于:

  • 四个专业模型分别对应从零创作、画面控制、演绎复刻到精细编辑的完整工作流,实现文本、图像、视频、音频全模态输入的统一创作体系
  • 全系列支持720P和1080P分辨率输出,视频时长可在2至15秒范围内任意指定
  • 最大的变化是新增了视频编辑模型(Wan2.7-videoedit),这是之前版本没有的,意味着你不仅能生成视频,还能对已有视频进行精细编辑和修改

简单说,2.7这一代的思路很明确:Image那边解决”人脸太假、颜色不准、文字写不对”的老毛病;Video那边从单纯的”生成”扩展到”生成+编辑”的全流程,把AI视频工具从一个”素材生成器”往”创作工具链”的方向推了一步。

用户已经可以在万相官网和阿里云百炼体验Wan2.7,千问App也即将接入。

相关导航

暂无评论

none
暂无评论...