教程 19 — OpenClaw Nano Banana Pro 教程:对话式 AI 文生图与图片编辑(Gemini 驱动,2026)
目标:安装 Nano Banana Pro Skill,让 OpenClaw 通过自然语言生成图片、编辑现有图片,支持 1K/2K/4K 分辨率。
什么是 Nano Banana Pro?
Nano Banana Pro 是 ClawHub 下载量排名前列的图像 Skill(72k 下载),底层由 Google Gemini 图像模型驱动,支持 text-to-image(文生图) 和 image-to-image(图片编辑) 两种模式。不需要单独注册 Midjourney 或 DALL-E 账号,通过 OpenClaw 的对话界面即可完成图像创作。
SEO 关键词覆盖:openclaw ai 文生图 免费 教程、openclaw 生成图片 4k 分辨率、nano banana pro gemini 图像 2026
第一步:安装依赖 CLI 工具
Nano Banana Pro 依赖 nano-banana-pro CLI。在终端执行:
npm install -g nano-banana-pro验证安装:
nano-banana-pro --version
# 应该输出版本号,如 2.4.1如果遇到权限报错,加 sudo 或改用 pnpm global 安装:
pnpm add -g nano-banana-pro第二步:安装 Skill
在 WebChat 或 Telegram 中发送:
/install @steipete/nano-banana-pro
验证安装成功:
pnpm openclaw skills list
# 列表中应出现 nano-banana-pro安装后 OpenClaw 会自动识别图像生成意图,无需额外配置 API Key(使用 OpenClaw 已绑定的 Gemini 配额)。
第三步:文生图基础用法(text-to-image)
直接用自然语言描述你想要的图片:
帮我生成一张图:赛博朋克风格的东京街头,霓虹灯反射在雨后的地面,夜晚氛围
或者使用斜杠命令:
/image 一只坐在云朵上的橘猫,宫崎骏动画风格,柔和配色
更多 prompt 示例:
/image 极简主义风格的咖啡品牌 Logo,黑白配色,无背景,适合商业使用
/image 2026 年科技感产品展示图:悬浮在空中的智能耳机,背景是渐变紫蓝色光晕
输出示例:AI 会直接在对话中展示生成的图片,并附上下载链接和生成耗时。
第四步:图片编辑(image-to-image)
如果你需要修改现有图片,使用 --input-image 参数传入原图:
修改这张图片,把背景改成白色,保留主体不变:--input-image ~/Desktop/product.jpg
或者直接描述编辑意图:
把这张照片的风格改成水彩画:~/Downloads/photo.png
帮我把图片里的文字去掉,保持背景自然填充
给这张产品图加上"NEW"角标,红色背景白色文字,放在右上角
openclaw 修改图片 ai 指令操作 的核心就在于用自然语言描述编辑意图,不需要打开 PS 或 Figma。
第五步:分辨率控制(1K/2K/4K)
通过 --resolution 参数控制输出尺寸:
# 1K(1024×1024)—— 快速预览,适合原型测试,消耗配额最少
/image --resolution 1k 城市夜景俯视图
# 2K(2048×2048)—— 日常使用的平衡点,适合社交媒体发布
/image --resolution 2k 产品宣传图,简洁背景
# 4K(4096×4096)—— 高清印刷级别,适合海报、封面,消耗配额较多
/image --resolution 4k 展会主视觉背景图,大气磅礴的山水画风格| 分辨率 | 适用场景 | 生成时间 | 配额消耗 |
|---|---|---|---|
| 1K | 快速测试、头像 | ~5 秒 | 1× |
| 2K | 社交媒体、网站 | ~15 秒 | 3× |
| 4K | 印刷、展览 | ~45 秒 | 8× |
openclaw 生成图片 4k 分辨率 建议只在确认构图满意后再升分辨率,先用 1K 调好 prompt。
第六步:实用 prompt 技巧
风格控制:在 prompt 末尾加风格关键词
一座现代化图书馆内部,大量自然光,暖色调 —— 摄影风格,85mm 镜头,浅景深
细节描述:从前景到背景分层描述
前景:一杯冒着热气的拿铁咖啡
中景:木质桌面,笔记本电脑半开着
背景:落地窗外的城市雪景,虚化处理
整体风格:INS 风,高饱和度,自然光
负向提示(排除不想要的元素):
/image 一个现代感的 App 界面截图,干净的 UI 设计 --negative 文字模糊,低分辨率,扭曲变形
第七步:批量生成多张图片对比选择
一次生成多个版本便于对比:
帮我生成 4 个版本的品牌 Logo 方案,主题是"AI + 海洋",风格各有差异
或者指定数量:
/image --count 4 --resolution 1k 极简科技感图标,圆形背景,不同配色方案
openclaw 图片输入输出 image-to-image 可以进一步对批量结果中最满意的一张做二次编辑细化。
常见问题
OpenClaw 能免费生成图片吗?
OpenClaw 本身是自托管的开源框架,Nano Banana Pro Skill 的图像生成调用底层的 Gemini 图像模型接口。如果你使用的是 Google AI Studio 的免费配额,在配额范围内生成 1K/2K 图片是免费的。超出免费配额后按 Gemini API 的标准计费,通常 1K 图片约 $0.003/张,远低于 Midjourney 订阅费用。建议在 OpenClaw 配置文件中设置月度用量上限,避免意外超支。
Nano Banana Pro 和 Midjourney 有什么区别?
Nano Banana Pro 的核心优势是集成在 OpenClaw 的对话流程中,你可以在同一个对话里完成"搜索参考图 → 生成 → 编辑 → 保存到 Notion"这样的完整工作流,不需要在多个工具间切换。Midjourney 在图像质量和艺术风格上目前略有优势,但它需要通过 Discord 操作,不支持编程式调用。如果你的主要需求是批量生成、自动化工作流、图片编辑,Nano Banana Pro 更适合。
生成的图片有版权吗?
根据 Google Gemini 的服务条款,通过 API 生成的图片版权归用户所有,可用于商业用途。但生成包含真实人物面孔、知名商标或受版权保护的艺术风格(如"宫崎骏风格")时,存在法律灰色地带,商业使用前建议咨询法律意见。生成的图片不得用于违法内容,Gemini API 内置了安全过滤器,会自动拒绝违规请求。
image-to-image 可以做哪些类型的编辑?
image-to-image 支持的编辑类型包括:背景替换(去背景/换背景)、风格迁移(把照片转成油画/水彩/漫画风)、局部修改(用自然语言描述要改的区域)、图片修复(去除水印、填充缺失区域)、颜色调整(改变特定区域的颜色)。对于精细的局部编辑,建议在 prompt 中尽量清晰地描述"哪个区域"做"什么改动",模型会尽量保留未描述的区域不变。