谷歌[1]
谷歌Gemini 2.5 Flash Image:多模态AI重塑图像创作边界
谷歌正式发布AI图像模型Gemini 2.5 Flash Image(前身为“nano-banana”),凭借多图语义级融合、2D转8视角3D模型及图像逻辑推理三大核心功能引发行业关注。该模型基于Diffusion Transformer架构,可实现跨图片光影匹配与跨模态理解,支持林黛玉服饰+赛博朋克背景等创意合成,单张产品图生成8视角3D模型,甚至能通过图像计算几何题、解析科学图表。目前已在Gemini平台及Google AI Studio免费开放,API按张计费(0.039美元/图),助力设计师高效完成创意合成、3D建模等任务,基于NeRF技术与27万张用户测试图优化,大幅降低专业图像创作门槛,重新定义AI驱动的视觉设计边界。