1. Vidu Q1参考生图功能全球上线

国产AI图像生成领域再添重磅选手。专注于视频大模型的Vidu正式推出“Vidu Q1参考生图”功能,并宣布全球同步上线。这一功能不仅以支持7张参考图的能力打破行业纪录,更在主体一致性上实现对谷歌Nano Banana的对标,将AI生图的创意自由度与实用性提升到新高度。无论是复杂场景的跨元素合成,还是多主体的风格统一,Vidu Q1都展现出远超同类产品的技术实力。

2. 7张参考图支持与多主体一致性控制

Vidu Q1参考生图的最大亮点在于对多参考图输入的突破性支持——单次可上传最多7张参考图片,这一数量远超当前主流产品:谷歌Nano Banana仅支持3张,而市面上多数工具甚至局限于1-3张。多图参考的核心价值在于解决复杂创作中的“主体稳定性”难题,例如同时合成多个人物、跨风格场景或跨次元角色时,传统工具常出现“参考模糊”“特征丢失”等问题,而Vidu Q1能精准捕捉每张参考图的主体特征(如人物面容、物体形态),并在生成结果中保持高度一致。

Tips:什么是“主体一致性”?
指AI生图时对参考图中核心主体(人物、物体)的特征还原能力,包括面部细节、轮廓、风格等。一致性不足会导致“生成的人不像参考图”“多次生成结果差异过大”,是行业长期存在的技术痛点。

此外,Vidu Q1支持1080p高清分辨率输出,单次最多生成4张图片,用户可自由选择宽高比,满足从社交分享到商业设计的多样化需求。操作上,用户可拖拽调整参考图顺序,通过“@”符号快速关联图片与提示词,大幅提升创作效率。

3. 竞品性能全面对比

在AI生图领域,“主体一致性”与“创意自由度”是核心竞争力。通过官方及第三方实测,Vidu Q1在这两方面已跻身全球第一梯队,具体对比数据如下:

产品名称 最大参考图数量 主体一致性能力 适用场景 复杂条件表现(多人/多场景)
Vidu Q1 7张 极高(对标Nano Banana) 多人、多场景、跨风格合成 稳定,特征无偏差
谷歌Nano Banana 3张 极高 多人、单一场景合成 较稳定,复杂场景偶有偏差
Flux Kontext 3张 中等 单人、单一场景合成 偏差率较高

从表格可见,Vidu Q1的7张参考图能力使其在创意自由度上形成显著差异化——用户可同时输入人物、场景、风格等多维度参考,实现“一次生成即满足全部需求”。而在一致性上,其与Nano Banana处于同一水平,且在多人、多场景的复杂合成中表现更稳定,彻底解决了“相似但不像”的行业痛点。

4. 多元应用场景解锁

Vidu Q1的多图参考能力不仅提升了创作自由度,更拓展了AI生图的应用边界。实测显示,其在以下场景中表现尤为突出:

4.1 创意合成

用户可通过多张参考图实现“违和元素的和谐融合”。例如上传“秦始皇画像”“北极熊照片”“上海外滩风景”“柠檬水”四张参考图,配合提示词“秦始皇骑在北极熊上,在上海外滩喝柠檬水,写实风格”,Vidu Q1能将这些跨时空元素自然合成,主体特征(如秦始皇的面容、北极熊的形态)均保持高度还原。

4.2 时尚穿搭

时尚博主或普通用户只需上传人物照片+多张服装参考图(如地中海风长裙、西海岸街头装),即可生成不同风格的穿搭效果。系统会自动匹配人物身形与服装版型,生成符合OOTD(今日穿搭)分享需求的图片,无需实际拍摄即可完成多套造型展示。

4.3 专业写真

无需专业设备,上传人物照片后,通过提示词调整背景(如“星空夜景”“极简工作室”)、光影(“侧逆光”“柔光”)和构图(“全身特写”“俯拍”),Vidu Q1可直接输出杂志封面级别的写真。对比传统写真,其优势在于背景、风格可无限切换,满足个性化需求。

4.4 多人合照

无论是现实人物与二次元角色,还是不同画风的动漫主角,只需上传各自参考图,Vidu Q1能让他们自然出现在同一画面中,且画风统一、互动合理。例如将《火影忍者》鸣人、《海贼王》路飞与现实人物合成“跨次元聚会照”,角色特征清晰可辨。

4.5 商业应用

在商业场景中,Vidu Q1支持手办3D效果生成(上传设计稿即可输出立体渲染图)、电商商品主体替换(如更换服装模特但保持服装细节)、设计稿风格迁移(将手绘稿转为写实/二次元风格)等,大幅降低企业内容制作成本。

5. 用户体验与操作流程

尽管功能强大,Vidu Q1的操作却十分简便,无需专业技术背景即可快速上手:

  1. 上传与调整:在参考生图页面上传最多7张图片,图片会显示在输入栏,支持拖拽排序;
  2. 关联提示词:输入提示词时,通过“@”符号可直接选择参考图,例如“@图1的人物穿着@图2的服装”,系统会自动关联对应主体;
  3. 优化生成:提供“创建主体”功能,支持输入人物常用数据(如发型、五官特征)或物体三视图,进一步提升还原精度;
  4. 批量输出:选择分辨率(默认1080p)、宽高比及生成数量(1-4张),点击生成即可等待结果。

6. 行业影响

Vidu Q1的推出标志着国产AI在图像生成领域首次实现对国际顶级产品的全面对标。生数科技(Vidu母公司)此前已通过视频大模型积累了深厚的多模态理解与生成技术,此次跨领域布局参考生图,不仅拓展了自身生态,更向行业释放了一个信号:中国AI企业正从“跟随创新”走向“引领创新”。

对于内容创作者而言,Vidu Q1将复杂创意的实现门槛从“专业团队”降至“个人用户”;对于品牌方,其高效的商业应用能力可缩短从设计到落地的周期。未来,随着技术迭代,AI生图有望从“辅助工具”升级为“生产主力”,而Vidu Q1无疑已走在了这一变革的前沿。

参考链接: