谷歌^[1]

前沿资讯

谷歌Gemini 2.5 Flash Image：多模态AI重塑图像创作边界

谷歌正式发布AI图像模型Gemini 2.5 Flash Image（前身为“nano-banana”），凭借多图语义级融合、2D转8视角3D模型及图像逻辑推理三大核心功能引发行业关注。该模型基于Diffusion Transformer架构，可实现跨图片光影匹配与跨模态理解，支持林黛玉服饰+赛博朋克背景等创意合成，单张产品图生成8视角3D模型，甚至能通过图像计算几何题、解析科学图表。目前已在Gemini平台及Google AI Studio免费开放，API按张计费（0.039美元/图），助力设计师高效完成创意合成、3D建模等任务，基于NeRF技术与27万张用户测试图优化，大幅降低专业图像创作门槛，重新定义AI驱动的视觉设计边界。

Lyra

2025-08-28

谷歌[1]

谷歌Gemini 2.5 Flash Image：多模态AI重塑图像创作边界

谷歌^[1]