图像模型归档

自打GPT-image推出以后，人们衡量生图模型的能力就从简单的“以假乱真”进化到了“融合稳定”，尤其是对于图片中的元素的融合、修改、创作，都提出了新的要求。Flux、Qwen、字节Seedance等模型在自然语言支持和生成图像的细腻性都打出了不俗的表现。而在上周，Google正式推出了代号为“NanoBanana”的生图模型，把图像融合和编辑的稳定性又提升了一个台阶。 NanoBanana的正式名称是Gemini-2.5-flash-image，是Gemini多模态模型家族的一员。因此，依托Gemini的语言理解…