模型简介
Gemini 2.5 Flash Image(gemini-2.5-flash-image
)是 Google 推出的正式版图像生成模型,相比预览版(gemini-2.5-flash-image-preview
)更稳定可靠。支持 OpenAI 兼容格式和 Google 原生格式两种调用方式。
🎉 正式版发布
- ✅ 稳定可靠,生产环境推荐使用
- 🎨 支持自定义纵横比(16:9、9:16 等 10 种比例)
- ⚡ 平均 10 秒生成高质量图片
- 💰 超值价格:$0.025/张(比官方便宜 37.5%)
🔀 两种调用方式
Gemini Flash Image 支持两种调用端点,各有优势:特性 | OpenAI 兼容模式 | Google 原生格式 |
---|---|---|
端点 | /v1/chat/completions | /v1beta/models/gemini-2.5-flash-image:generateContent |
模型名 | gemini-2.5-flash-image | URL 中指定 |
图片尺寸 | 固定 1:1 | 支持 10 种纵横比 |
兼容性 | 完美兼容 OpenAI SDK | 需要原生调用 |
返回格式 | Base64 | Base64 |
使用场景 | 快速迁移、简单需求 | 需要自定义尺寸 |
纵横比支持 | ❌ 否 | ✅ 21:9, 16:9, 4:3, 3:2, 1:1, 9:16, 3:4, 2:3, 5:4, 4:5 |
💡 如何选择?
- 如果只需要正方形(1:1)图片,使用 OpenAI 兼容模式更简单
- 如果需要宽屏(16:9)、竖屏(9:16)等特定比例,使用 Google 原生格式
🌟 核心特性
- ⚡ 极速响应:平均 10 秒生成,显著快于 OpenAI 系列
- 💰 超值价格:0.04/张)便宜 37.5%
- 🔄 双重兼容:支持 OpenAI SDK 和 Google 原生格式
- 📐 灵活尺寸:Google 原生格式支持 10 种纵横比
- 📦 Base64 输出:直接返回 base64 编码图片数据,无需二次下载
- 🎨 Google 技术:基于 Google 最新图像生成技术,质量出众
📋 模型对比
模型 | 模型 ID | 计费方式 | 老张API价格 | 官方价格 | 节省比例 | 速度 |
---|---|---|---|---|---|---|
Gemini Flash Image | gemini-2.5-flash-image | 按次计费 | $0.025/张 | $0.04/张 | 37.5% | ~10秒 |
GPT-Image-1 | gpt-image-1 | 按Token | 40输出 per M | - | - | 中等 |
Flux Kontext Pro | flux-kontext-pro | 按次计费 | $0.035/张 | $0.04/张 | 12.5% | 快速 |
Sora Image | sora_image | 按次计费 | $0.01/张 | - | - | 较慢 |
💡 价格优势
- 比官方价格便宜 37.5%
- 充值 100 美金 +10% 赠送,叠加汇率优势,总体是官网 7.3 折
- 价格透明可预测,无需担心 Token 消耗
🚀 快速开始
准备工作
💰 价格优势详解
- 老张API价格:$0.025/张(比官网便宜 37.5%)
- 官网价格:$0.04/张
- 充值优惠:充值 100 美金 +10% 赠送
- 汇率优势:叠加汇率优势,总体相当于官网 7.3 折
方式一:OpenAI 兼容模式(1:1 图片)
基础示例 - Curl
Python SDK 示例
方式二:Google 原生格式(支持自定义纵横比)
支持的纵横比
类型 | 纵横比选项 |
---|---|
横向 | 21:9(超宽屏), 16:9(宽屏), 4:3, 3:2 |
正方形 | 1:1 |
纵向 | 9:16(竖屏), 3:4, 2:3 |
其他 | 5:4, 4:5 |
简单 Curl 示例
Python 完整工具脚本
展开查看完整 Python 脚本(支持纵横比配置)
展开查看完整 Python 脚本(支持纵横比配置)
Bash 脚本示例
展开查看完整 Bash 脚本(支持纵横比配置)
展开查看完整 Bash 脚本(支持纵横比配置)
💡 最佳实践
提示词优化
明确描述
使用具体、详细的描述,包括主体、风格、颜色、光线等
参考风格
可以指定艺术风格:“油画风格”、“水彩画”、“赛博朋克风格”等
避免模糊
避免使用过于抽象或模糊的词汇
英文优先
英文提示词通常效果更好,中文也支持
纵横比选择建议
用途 | 推荐纵横比 |
---|---|
社交媒体横图 | 16:9 |
手机壁纸/竖屏 | 9:16 |
Instagram 正方形 | 1:1 |
打印照片 | 4:3 或 3:2 |
电影海报 | 2:3 |
横幅广告 | 21:9 |
❓ 常见问题
如何选择调用方式?
如何选择调用方式?
- 如果只需要 1:1 正方形图片,使用 OpenAI 兼容模式更简单,完美兼容现有代码
- 如果需要特定纵横比(如 16:9 宽屏),使用 Google 原生格式
- 两种方式价格相同,都是 $0.025/张
支持哪些纵横比?
支持哪些纵横比?
Google 原生格式支持 10 种纵横比:
- 横向:21:9, 16:9, 4:3, 3:2
- 正方形:1:1
- 纵向:9:16, 3:4, 2:3
- 其他:5:4, 4:5
与 Preview 版本有什么区别?
与 Preview 版本有什么区别?
- 正式版 (
gemini-2.5-flash-image
):稳定可靠,生产环境推荐 - 预览版 (
gemini-2.5-flash-image-preview
):即将下线,建议迁移 - 价格、速度、质量完全相同,只需更新模型名称即可迁移
如何获取更好的生成效果?
如何获取更好的生成效果?
- 详细描述:提供具体的细节(颜色、风格、场景等)
- 英文提示词:英文通常效果更好
- 参考风格:指定艺术风格(如”油画风格”、“水彩画”)
- 多次尝试:可以用不同的提示词尝试,价格低廉
返回的 Base64 数据如何使用?
返回的 Base64 数据如何使用?
Base64 数据可以直接在网页中显示:或者解码保存为文件(参考上面的代码示例)