教程 19 — OpenClaw Nano Banana Pro 教程：對話式 AI 文生圖與圖片編輯（Gemini 驅動，2026）

目標：安裝 Nano Banana Pro Skill，讓 OpenClaw 通過自然語言生成圖片、編輯現有圖片，支援 1K/2K/4K 解析度。

什麼是 Nano Banana Pro？

Nano Banana Pro 是 ClawHub 下載量排名前列的圖像 Skill（72k 下載），底層由 Google Gemini 圖像模型驅動，支援 text-to-image（文生圖） 和 image-to-image（圖片編輯） 兩種模式。不需要單獨註冊 Midjourney 或 DALL-E 帳號，通過 OpenClaw 的對話介面即可完成圖像創作。

SEO 關鍵詞覆蓋：openclaw ai 文生圖免費教程、openclaw 生成圖片 4k 解析度、nano banana pro gemini 圖像 2026

第一步：安裝依賴 CLI 工具

Nano Banana Pro 依賴 nano-banana-pro CLI。在終端執行：

npm install -g nano-banana-pro

驗證安裝：

nano-banana-pro --version
# 應該輸出版本號，如 2.4.1

如果遇到權限報錯，加 sudo 或改用 pnpm global 安裝：

pnpm add -g nano-banana-pro

第二步：安裝 Skill

在 WebChat 或 Telegram 中發送：

/install @steipete/nano-banana-pro

驗證安裝成功：

pnpm openclaw skills list
# 列表中應出現 nano-banana-pro

安裝後 OpenClaw 會自動識別圖像生成意圖，無需額外配置 API Key（使用 OpenClaw 已綁定的 Gemini 配額）。

第三步：文生圖基礎用法（text-to-image）

直接用自然語言描述你想要的圖片：

幫我生成一張圖：賽博朋克風格的東京街頭，霓虹燈反射在雨後的地面，夜晚氛圍

或者使用斜線命令：

/image 一隻坐在雲朵上的橘貓，宮崎駿動畫風格，柔和配色

更多 prompt 示例：

/image 極簡主義風格的咖啡品牌 Logo，黑白配色，無背景，適合商業使用

/image 2026 年科技感產品展示圖：懸浮在空中的智慧耳機，背景是漸變紫藍色光暈

輸出示例：AI 會直接在對話中展示生成的圖片，並附上下載連結和生成耗時。

第四步：圖片編輯（image-to-image）

如果你需要修改現有圖片，使用 --input-image 參數傳入原圖：

修改這張圖片，把背景改成白色，保留主體不變：--input-image ~/Desktop/product.jpg

或者直接描述編輯意圖：

把這張照片的風格改成水彩畫：~/Downloads/photo.png
幫我把圖片裡的文字去掉，保持背景自然填充
給這張產品圖加上「NEW」角標，紅色背景白色文字，放在右上角

openclaw 修改圖片 ai 指令操作 的核心就在於用自然語言描述編輯意圖，不需要打開 PS 或 Figma。

第五步：解析度控制（1K/2K/4K）

通過 --resolution 參數控制輸出尺寸：

# 1K（1024×1024）—— 快速預覽，適合原型測試，消耗配額最少
/image --resolution 1k 城市夜景俯視圖
 
# 2K（2048×2048）—— 日常使用的平衡點，適合社群媒體發布
/image --resolution 2k 產品宣傳圖，簡潔背景
 
# 4K（4096×4096）—— 高清印刷級別，適合海報、封面，消耗配額較多
/image --resolution 4k 展會主視覺背景圖，大氣磅礴的山水畫風格

解析度	適用場景	生成時間	配額消耗
1K	快速測試、頭像	~5 秒	1×
2K	社群媒體、網站	~15 秒	3×
4K	印刷、展覽	~45 秒	8×

openclaw 生成圖片 4k 解析度 建議只在確認構圖滿意後再升解析度，先用 1K 調好 prompt。

第六步：實用 prompt 技巧

風格控制：在 prompt 末尾加風格關鍵詞

一座現代化圖書館內部，大量自然光，暖色調 —— 攝影風格，85mm 鏡頭，淺景深

細節描述：從前景到背景分層描述

前景：一杯冒著熱氣的拿鐵咖啡
中景：木質桌面，筆記型電腦半開著
背景：落地窗外的城市雪景，虛化處理
整體風格：INS 風，高飽和度，自然光

負向提示（排除不想要的元素）：

/image 一個現代感的 App 介面截圖，乾淨的 UI 設計 --negative 文字模糊,低解析度,扭曲變形

第七步：批量生成多張圖片對比選擇

一次生成多個版本便於對比：

幫我生成 4 個版本的品牌 Logo 方案，主題是「AI + 海洋」，風格各有差異

或者指定數量：

/image --count 4 --resolution 1k 極簡科技感圖示，圓形背景，不同配色方案

openclaw 圖片輸入輸出 image-to-image 可以進一步對批量結果中最滿意的一張做二次編輯細化。

常見問題

OpenClaw 能免費生成圖片嗎？

OpenClaw 本身是自託管的開源框架，Nano Banana Pro Skill 的圖像生成調用底層的 Gemini 圖像模型介面。如果你使用的是 Google AI Studio 的免費配額，在配額範圍內生成 1K/2K 圖片是免費的。超出免費配額後按 Gemini API 的標準計費，通常 1K 圖片約 $0.003/張，遠低於 Midjourney 訂閱費用。建議在 OpenClaw 配置檔案中設定月度用量上限，避免意外超支。

Nano Banana Pro 和 Midjourney 有什麼區別？

Nano Banana Pro 的核心優勢是整合在 OpenClaw 的對話流程中，你可以在同一個對話裡完成「搜尋參考圖 → 生成 → 編輯 → 儲存到 Notion」這樣的完整工作流，不需要在多個工具間切換。Midjourney 在圖像品質和藝術風格上目前略有優勢，但它需要通過 Discord 操作，不支援程式化調用。如果你的主要需求是批量生成、自動化工作流、圖片編輯，Nano Banana Pro 更適合。

生成的圖片有版權嗎？

根據 Google Gemini 的服務條款，通過 API 生成的圖片版權歸使用者所有，可用於商業用途。但生成包含真實人物面孔、知名商標或受版權保護的藝術風格（如「宮崎駿風格」）時，存在法律灰色地帶，商業使用前建議諮詢法律意見。生成的圖片不得用於違法內容，Gemini API 內建了安全過濾器，會自動拒絕違規請求。

image-to-image 可以做哪些類型的編輯？

image-to-image 支援的編輯類型包括：背景替換（去背景/換背景）、風格遷移（把照片轉成油畫/水彩/漫畫風）、局部修改（用自然語言描述要改的區域）、圖片修復（去除浮水印、填充缺失區域）、顏色調整（改變特定區域的顏色）。對於精細的局部編輯，建議在 prompt 中盡量清晰地描述「哪個區域」做「什麼改動」，模型會盡量保留未描述的區域不變。

下一步

教程 20 — 安裝 Obsidian Skill，把生成的圖片和創作過程自動存進 Obsidian 筆記
教程 11 — 安裝前先用 Skill Vetter 做安全檢查