自打GPT-image推出以后,人们衡量生图模型的能力就从简单的“以假乱真”进化到了“融合稳定”,尤其是对于图片中的元素的融合、修改、创作,都提出了新的要求。Flux、Qwen、字节Seedance等模型在自然语言支持和生成图像的细腻性都打出了不俗的表现。而在上周,Google正式推出了代号为“NanoBanana”的生图模型,把图像融合和编辑的稳定性又提升了一个台阶。 NanoBanana的正式名称是Gemini-2.5-flash-image,是Gemini多模态模型家族的一员。因此,依托Gemini的语言理解…