1. Vidu Q1参考生图功能全球上线
国产AI图像生成领域再添重磅选手。专注于视频大模型的Vidu正式推出“Vidu Q1参考生图”功能,并宣布全球同步上线。这一功能不仅以支持7张参考图的能力打破行业纪录,更在主体一致性上实现对谷歌Nano Banana的对标,将AI生图的创意自由度与实用性提升到新高度。无论是复杂场景的跨元素合成,还是多主体的风格统一,Vidu Q1都展现出远超同类产品的技术实力。
2. 7张参考图支持与多主体一致性控制
Vidu Q1参考生图的最大亮点在于对多参考图输入的突破性支持——单次可上传最多7张参考图片,这一数量远超当前主流产品:谷歌Nano Banana仅支持3张,而市面上多数工具甚至局限于1-3张。多图参考的核心价值在于解决复杂创作中的“主体稳定性”难题,例如同时合成多个人物、跨风格场景或跨次元角色时,传统工具常出现“参考模糊”“特征丢失”等问题,而Vidu Q1能精准捕捉每张参考图的主体特征(如人物面容、物体形态),并在生成结果中保持高度一致。
Tips:什么是“主体一致性”?
指AI生图时对参考图中核心主体(人物、物体)的特征还原能力,包括面部细节、轮廓、风格等。一致性不足会导致“生成的人不像参考图”“多次生成结果差异过大”,是行业长期存在的技术痛点。
此外,Vidu Q1支持1080p高清分辨率输出,单次最多生成4张图片,用户可自由选择宽高比,满足从社交分享到商业设计的多样化需求。操作上,用户可拖拽调整参考图顺序,通过“@”符号快速关联图片与提示词,大幅提升创作效率。
3. 竞品性能全面对比
在AI生图领域,“主体一致性”与“创意自由度”是核心竞争力。通过官方及第三方实测,Vidu Q1在这两方面已跻身全球第一梯队,具体对比数据如下:
产品名称 | 最大参考图数量 | 主体一致性能力 | 适用场景 | 复杂条件表现(多人/多场景) |
---|---|---|---|---|
Vidu Q1 | 7张 | 极高(对标Nano Banana) | 多人、多场景、跨风格合成 | 稳定,特征无偏差 |
谷歌Nano Banana | 3张 | 极高 | 多人、单一场景合成 | 较稳定,复杂场景偶有偏差 |
Flux Kontext | 3张 | 中等 | 单人、单一场景合成 | 偏差率较高 |
从表格可见,Vidu Q1的7张参考图能力使其在创意自由度上形成显著差异化——用户可同时输入人物、场景、风格等多维度参考,实现“一次生成即满足全部需求”。而在一致性上,其与Nano Banana处于同一水平,且在多人、多场景的复杂合成中表现更稳定,彻底解决了“相似但不像”的行业痛点。
4. 多元应用场景解锁
Vidu Q1的多图参考能力不仅提升了创作自由度,更拓展了AI生图的应用边界。实测显示,其在以下场景中表现尤为突出:
4.1 创意合成
用户可通过多张参考图实现“违和元素的和谐融合”。例如上传“秦始皇画像”“北极熊照片”“上海外滩风景”“柠檬水”四张参考图,配合提示词“秦始皇骑在北极熊上,在上海外滩喝柠檬水,写实风格”,Vidu Q1能将这些跨时空元素自然合成,主体特征(如秦始皇的面容、北极熊的形态)均保持高度还原。
4.2 时尚穿搭
时尚博主或普通用户只需上传人物照片+多张服装参考图(如地中海风长裙、西海岸街头装),即可生成不同风格的穿搭效果。系统会自动匹配人物身形与服装版型,生成符合OOTD(今日穿搭)分享需求的图片,无需实际拍摄即可完成多套造型展示。
4.3 专业写真
无需专业设备,上传人物照片后,通过提示词调整背景(如“星空夜景”“极简工作室”)、光影(“侧逆光”“柔光”)和构图(“全身特写”“俯拍”),Vidu Q1可直接输出杂志封面级别的写真。对比传统写真,其优势在于背景、风格可无限切换,满足个性化需求。
4.4 多人合照
无论是现实人物与二次元角色,还是不同画风的动漫主角,只需上传各自参考图,Vidu Q1能让他们自然出现在同一画面中,且画风统一、互动合理。例如将《火影忍者》鸣人、《海贼王》路飞与现实人物合成“跨次元聚会照”,角色特征清晰可辨。
4.5 商业应用
在商业场景中,Vidu Q1支持手办3D效果生成(上传设计稿即可输出立体渲染图)、电商商品主体替换(如更换服装模特但保持服装细节)、设计稿风格迁移(将手绘稿转为写实/二次元风格)等,大幅降低企业内容制作成本。
5. 用户体验与操作流程
尽管功能强大,Vidu Q1的操作却十分简便,无需专业技术背景即可快速上手:
- 上传与调整:在参考生图页面上传最多7张图片,图片会显示在输入栏,支持拖拽排序;
- 关联提示词:输入提示词时,通过“@”符号可直接选择参考图,例如“@图1的人物穿着@图2的服装”,系统会自动关联对应主体;
- 优化生成:提供“创建主体”功能,支持输入人物常用数据(如发型、五官特征)或物体三视图,进一步提升还原精度;
- 批量输出:选择分辨率(默认1080p)、宽高比及生成数量(1-4张),点击生成即可等待结果。
6. 行业影响
Vidu Q1的推出标志着国产AI在图像生成领域首次实现对国际顶级产品的全面对标。生数科技(Vidu母公司)此前已通过视频大模型积累了深厚的多模态理解与生成技术,此次跨领域布局参考生图,不仅拓展了自身生态,更向行业释放了一个信号:中国AI企业正从“跟随创新”走向“引领创新”。
对于内容创作者而言,Vidu Q1将复杂创意的实现门槛从“专业团队”降至“个人用户”;对于品牌方,其高效的商业应用能力可缩短从设计到落地的周期。未来,随着技术迭代,AI生图有望从“辅助工具”升级为“生产主力”,而Vidu Q1无疑已走在了这一变革的前沿。
评论