跳转到主要内容
Nano Banana 是 Google 推出的 Gemini 系列 AI 生图模型,支持通过文本、图片或两者结合的方式,以对话形式生成和编辑图片。 该系列包含两个主要模型,分别面向 速度/吞吐画质/表现力 两个方向:
模型别名官方模型名定位
nano-bananagemini-2.5-flash-image速度优先,高吞吐低延迟
nano-banana-progemini-3-pro-image-preview质量优先,支持 4K 高清与高级文本渲染
Poixe 系统支持使用 模型别名官方原生模型名 调用。 别名仅为内部映射,如官方后续更新/替换模型,我们可能会同步调整别名映射以保持可用。

效果展示

Nano Banana 在文本渲染、复杂构图及东方美学理解上表现优异。
nano banana old bridge

模型对比

特性Nano BananaNano Banana Pro
生成速度~10秒~20秒
最大分辨率1024×10244096×4096 (4K)
文本渲染基础优秀
参考图片数量最多 3 张最多 14 张
推理能力标准高级(思考模式)
局部编辑基础高级(角度、焦点、色彩、光照)
选择建议
  • 需要快速出图、常规场景 → nano-banana
  • 需要高清晰度、文字渲染、专业设计 → nano-banana-pro

计费标准

Nano Banana 系列遵循 Google 官方的计费逻辑,同时享受 Poixe 平台的用户等级折扣。 模型基础计费分为三部分:提示词输入(Text/Image Input)、文本/思考输出(Text Output)、图像生成输出(Image Output)。
对应 nano-bananagemini-2.5-flash-image
  • 输入 (文字/图片):$0.30 / 1M Tokens
  • 输出 (文本):$2.50 / 1M Tokens
  • 输出 (图片):$30.00 / 1M Tokens
  • 折算单价:每张标准图(1024x1024)消耗 1290 tokens,约 $0.039/张
注意:以上仅为官方计费标准,Poixe 平台最终价格会在上述官方价格基础上,根据您的权益等级(Level)进行折扣计算。

快速开始

Poixe 通过 Google Gemini Content 协议 来提供 Nano Banana 系列模型,这也是官方推荐的调用方式。请参考以下文档了解详情:
注意:Nano Banana 系列模型因为涉及图片生成,响应时间通常较长,我们推荐使用无 CDN 长连接更友好的副接口地址,相关配置请参考 接口地址如果您在调用过程中,连接意外中断,可以参考 中断响应找回 文档,使用 Poixe 提供的恢复机制继续获取未完成的响应内容。

请求示例

curl "https://api.poixe.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $POIXE_API_KEY" \
  -H "Content-Type: application/json" \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "一只橘猫坐在窗台上看雨,赛博朋克风格"
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["Text", "Image"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }'

响应示例

{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "这是一只橘猫坐在窗台上看雨的赛博朋克风格图片。"
          },
          {
            "inlineData": {
              "mimeType": "image/png",
              "data": "iVBORw0KGgoAAAANSUhEUgAA..."
            },
            "thoughtSignature": "EtORtgIKzpG2Ag..."
          }
        ],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 14,
    "candidatesTokenCount": 1253,
    "totalTokenCount": 1490,
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 14
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "IMAGE",
        "tokenCount": 1120
      }
    ],
    "thoughtsTokenCount": 223
  },
  "modelVersion": "gemini-3-pro-image-preview",
  "responseId": "cKaFae-1Ee307M8Py5OosAE"
}

输出预览

图片数据以 base64 编码返回,解码后即可获得 PNG/JPEG 格式图片。 nano banana pro output
可以使用在线工具(如 Base64 Image Viewer)或编程方式解码 base64 图片数据。

参数配置

输出类型

通过 responseModalities 控制返回内容:
{
  "generationConfig": {
    "responseModalities": ["Image"] // 仅返回图片,不含文本
  }
}
支持的格式:TextImage

宽高比

通过 imageConfig.aspectRatio 设置画幅:
{
  "generationConfig": {
    "imageConfig": {
      "aspectRatio": "16:9" // 设置画幅为 16:9
    }
  }
}
支持的宽高比:1:12:33:23:44:34:55:49:1616:921:9

分辨率(仅 Nano Banana Pro)

nano-banana-pro 支持指定输出分辨率:
{
  "generationConfig": {
    "imageConfig": {
      "aspectRatio": "16:9",
      "imageSize": "4K" // 设置分辨率为 4K
    }
  }
}
支持的宽高比: 1K(1024x1024)、2K(2048x2048)、4K(4096x4096)

Nano Banana Pro 独有功能

nano-banana-pro (gemini-3-pro-image-preview) 提供以下高级特性:
  • 4K 高清输出:支持 1K/2K/4K 三档分辨率
  • 高级文本渲染:适用于信息图表、菜单、营销素材等场景
  • 思考模式:模型会先生成构思草图,再输出最终高质量图片
  • 多参考图混合:最多支持 14 张参考图片(含 6 张高保真对象图 + 5 张人物图)
  • Google 搜索接地:可基于实时数据生成图像(天气、股票等)

使用限制

  • 最佳支持语言:英语、中文、日语、韩语、法语、德语、西班牙语等主流语言
  • 不支持音频或视频输入
  • 所有生成图片包含 SynthID 水印
  • 文字渲染建议:先让模型生成文字内容,再要求生成包含该文字的图片

客户端使用

推荐使用 Cherry Studio 进行调用。配置模型提供商时,选择 Google Gemini 原生协议

提示词资源

常见问题

  • 快速出图、常规场景 → nano-bananagemini-2.5-flash-image
  • 高清输出、文字渲染、专业设计 → nano-banana-progemini-3-pro-image-preview
完全相同。nano-banana 是 Poixe 系统内的别名映射,实际调用的是 gemini-2.5-flash-image同理,nano-banana-pro 对应 gemini-3-pro-image-preview,也是完全相同的模型。为保证稳定性,建议直接使用官方模型名。
返回 base64 编码的图片数据,通常为 PNG 或 JPEG 格式,解码后即可使用。
支持。可以上传图片并通过对话方式进行编辑,Nano Banana Pro 模型的局部编辑能力更强大。
模型不一定严格按照用户要求的数量生成图片,这是模型的已知限制。

相关链接