教程 19 — OpenClaw Nano Banana Pro 教程：对话式 AI 文生图与图片编辑（Gemini 驱动，2026）

Q: Nano Banana Pro 和 Midjourney 有什么区别？

Nano Banana Pro 的核心优势是集成在 OpenClaw 的对话流程中，你可以在同一个对话里完成"搜索参考图 → 生成 → 编辑 → 保存到 Notion"这样的完整工作流，不需要在多个工具间切换。Midjourney 在图像质量和艺术风格上目前略有优势，但它需要通过 Discord 操作，不支持编程式调用。如果你的主要需求是批量生成、自动化工作流、图片编辑，Nano Banana Pro 更适合。

目标：安装 Nano Banana Pro Skill，让 OpenClaw 通过自然语言生成图片、编辑现有图片，支持 1K/2K/4K 分辨率。

什么是 Nano Banana Pro？

Nano Banana Pro 是 ClawHub 下载量排名前列的图像 Skill（72k 下载），底层由 Google Gemini 图像模型驱动，支持 text-to-image（文生图） 和 image-to-image（图片编辑） 两种模式。不需要单独注册 Midjourney 或 DALL-E 账号，通过 OpenClaw 的对话界面即可完成图像创作。

SEO 关键词覆盖：openclaw ai 文生图免费教程、openclaw 生成图片 4k 分辨率、nano banana pro gemini 图像 2026

第一步：安装依赖 CLI 工具

Nano Banana Pro 依赖 nano-banana-pro CLI。在终端执行：

npm install -g nano-banana-pro

验证安装：

nano-banana-pro --version
# 应该输出版本号，如 2.4.1

如果遇到权限报错，加 sudo 或改用 pnpm global 安装：

pnpm add -g nano-banana-pro

第二步：安装 Skill

在 WebChat 或 Telegram 中发送：

/install @steipete/nano-banana-pro

验证安装成功：

pnpm openclaw skills list
# 列表中应出现 nano-banana-pro

安装后 OpenClaw 会自动识别图像生成意图，无需额外配置 API Key（使用 OpenClaw 已绑定的 Gemini 配额）。

第三步：文生图基础用法（text-to-image）

直接用自然语言描述你想要的图片：

帮我生成一张图：赛博朋克风格的东京街头，霓虹灯反射在雨后的地面，夜晚氛围

或者使用斜杠命令：

/image 一只坐在云朵上的橘猫，宫崎骏动画风格，柔和配色

更多 prompt 示例：

/image 极简主义风格的咖啡品牌 Logo，黑白配色，无背景，适合商业使用

/image 2026 年科技感产品展示图：悬浮在空中的智能耳机，背景是渐变紫蓝色光晕

输出示例：AI 会直接在对话中展示生成的图片，并附上下载链接和生成耗时。

第四步：图片编辑（image-to-image）

如果你需要修改现有图片，使用 --input-image 参数传入原图：

修改这张图片，把背景改成白色，保留主体不变：--input-image ~/Desktop/product.jpg

或者直接描述编辑意图：

把这张照片的风格改成水彩画：~/Downloads/photo.png
帮我把图片里的文字去掉，保持背景自然填充
给这张产品图加上"NEW"角标，红色背景白色文字，放在右上角

openclaw 修改图片 ai 指令操作 的核心就在于用自然语言描述编辑意图，不需要打开 PS 或 Figma。

第五步：分辨率控制（1K/2K/4K）

通过 --resolution 参数控制输出尺寸：

# 1K（1024×1024）—— 快速预览，适合原型测试，消耗配额最少
/image --resolution 1k 城市夜景俯视图
 
# 2K（2048×2048）—— 日常使用的平衡点，适合社交媒体发布
/image --resolution 2k 产品宣传图，简洁背景
 
# 4K（4096×4096）—— 高清印刷级别，适合海报、封面，消耗配额较多
/image --resolution 4k 展会主视觉背景图，大气磅礴的山水画风格

分辨率	适用场景	生成时间	配额消耗
1K	快速测试、头像	~5 秒	1×
2K	社交媒体、网站	~15 秒	3×
4K	印刷、展览	~45 秒	8×

openclaw 生成图片 4k 分辨率 建议只在确认构图满意后再升分辨率，先用 1K 调好 prompt。

第六步：实用 prompt 技巧

风格控制：在 prompt 末尾加风格关键词

一座现代化图书馆内部，大量自然光，暖色调 —— 摄影风格，85mm 镜头，浅景深

细节描述：从前景到背景分层描述

前景：一杯冒着热气的拿铁咖啡
中景：木质桌面，笔记本电脑半开着
背景：落地窗外的城市雪景，虚化处理
整体风格：INS 风，高饱和度，自然光

负向提示（排除不想要的元素）：

/image 一个现代感的 App 界面截图，干净的 UI 设计 --negative 文字模糊,低分辨率,扭曲变形

第七步：批量生成多张图片对比选择

一次生成多个版本便于对比：

帮我生成 4 个版本的品牌 Logo 方案，主题是"AI + 海洋"，风格各有差异

或者指定数量：

/image --count 4 --resolution 1k 极简科技感图标，圆形背景，不同配色方案

openclaw 图片输入输出 image-to-image 可以进一步对批量结果中最满意的一张做二次编辑细化。

常见问题

OpenClaw 能免费生成图片吗？

OpenClaw 本身是自托管的开源框架，Nano Banana Pro Skill 的图像生成调用底层的 Gemini 图像模型接口。如果你使用的是 Google AI Studio 的免费配额，在配额范围内生成 1K/2K 图片是免费的。超出免费配额后按 Gemini API 的标准计费，通常 1K 图片约 $0.003/张，远低于 Midjourney 订阅费用。建议在 OpenClaw 配置文件中设置月度用量上限，避免意外超支。

Nano Banana Pro 和 Midjourney 有什么区别？

Nano Banana Pro 的核心优势是集成在 OpenClaw 的对话流程中，你可以在同一个对话里完成"搜索参考图 → 生成 → 编辑 → 保存到 Notion"这样的完整工作流，不需要在多个工具间切换。Midjourney 在图像质量和艺术风格上目前略有优势，但它需要通过 Discord 操作，不支持编程式调用。如果你的主要需求是批量生成、自动化工作流、图片编辑，Nano Banana Pro 更适合。

生成的图片有版权吗？

根据 Google Gemini 的服务条款，通过 API 生成的图片版权归用户所有，可用于商业用途。但生成包含真实人物面孔、知名商标或受版权保护的艺术风格（如"宫崎骏风格"）时，存在法律灰色地带，商业使用前建议咨询法律意见。生成的图片不得用于违法内容，Gemini API 内置了安全过滤器，会自动拒绝违规请求。

image-to-image 可以做哪些类型的编辑？

image-to-image 支持的编辑类型包括：背景替换（去背景/换背景）、风格迁移（把照片转成油画/水彩/漫画风）、局部修改（用自然语言描述要改的区域）、图片修复（去除水印、填充缺失区域）、颜色调整（改变特定区域的颜色）。对于精细的局部编辑，建议在 prompt 中尽量清晰地描述"哪个区域"做"什么改动"，模型会尽量保留未描述的区域不变。

下一步

教程 20 — 安装 Obsidian Skill，把生成的图片和创作过程自动存进 Obsidian 笔记
教程 11 — 安装前先用 Skill Vetter 做安全检查