教程 19 — OpenClaw Nano Banana Pro 教程:對話式 AI 文生圖與圖片編輯(Gemini 驅動,2026)
目標:安裝 Nano Banana Pro Skill,讓 OpenClaw 通過自然語言生成圖片、編輯現有圖片,支援 1K/2K/4K 解析度。
什麼是 Nano Banana Pro?
Nano Banana Pro 是 ClawHub 下載量排名前列的圖像 Skill(72k 下載),底層由 Google Gemini 圖像模型驅動,支援 text-to-image(文生圖) 和 image-to-image(圖片編輯) 兩種模式。不需要單獨註冊 Midjourney 或 DALL-E 帳號,通過 OpenClaw 的對話介面即可完成圖像創作。
SEO 關鍵詞覆蓋:openclaw ai 文生圖 免費 教程、openclaw 生成圖片 4k 解析度、nano banana pro gemini 圖像 2026
第一步:安裝依賴 CLI 工具
Nano Banana Pro 依賴 nano-banana-pro CLI。在終端執行:
npm install -g nano-banana-pro驗證安裝:
nano-banana-pro --version
# 應該輸出版本號,如 2.4.1如果遇到權限報錯,加 sudo 或改用 pnpm global 安裝:
pnpm add -g nano-banana-pro第二步:安裝 Skill
在 WebChat 或 Telegram 中發送:
/install @steipete/nano-banana-pro
驗證安裝成功:
pnpm openclaw skills list
# 列表中應出現 nano-banana-pro安裝後 OpenClaw 會自動識別圖像生成意圖,無需額外配置 API Key(使用 OpenClaw 已綁定的 Gemini 配額)。
第三步:文生圖基礎用法(text-to-image)
直接用自然語言描述你想要的圖片:
幫我生成一張圖:賽博朋克風格的東京街頭,霓虹燈反射在雨後的地面,夜晚氛圍
或者使用斜線命令:
/image 一隻坐在雲朵上的橘貓,宮崎駿動畫風格,柔和配色
更多 prompt 示例:
/image 極簡主義風格的咖啡品牌 Logo,黑白配色,無背景,適合商業使用
/image 2026 年科技感產品展示圖:懸浮在空中的智慧耳機,背景是漸變紫藍色光暈
輸出示例:AI 會直接在對話中展示生成的圖片,並附上下載連結和生成耗時。
第四步:圖片編輯(image-to-image)
如果你需要修改現有圖片,使用 --input-image 參數傳入原圖:
修改這張圖片,把背景改成白色,保留主體不變:--input-image ~/Desktop/product.jpg
或者直接描述編輯意圖:
把這張照片的風格改成水彩畫:~/Downloads/photo.png
幫我把圖片裡的文字去掉,保持背景自然填充
給這張產品圖加上「NEW」角標,紅色背景白色文字,放在右上角
openclaw 修改圖片 ai 指令操作 的核心就在於用自然語言描述編輯意圖,不需要打開 PS 或 Figma。
第五步:解析度控制(1K/2K/4K)
通過 --resolution 參數控制輸出尺寸:
# 1K(1024×1024)—— 快速預覽,適合原型測試,消耗配額最少
/image --resolution 1k 城市夜景俯視圖
# 2K(2048×2048)—— 日常使用的平衡點,適合社群媒體發布
/image --resolution 2k 產品宣傳圖,簡潔背景
# 4K(4096×4096)—— 高清印刷級別,適合海報、封面,消耗配額較多
/image --resolution 4k 展會主視覺背景圖,大氣磅礴的山水畫風格| 解析度 | 適用場景 | 生成時間 | 配額消耗 |
|---|---|---|---|
| 1K | 快速測試、頭像 | ~5 秒 | 1× |
| 2K | 社群媒體、網站 | ~15 秒 | 3× |
| 4K | 印刷、展覽 | ~45 秒 | 8× |
openclaw 生成圖片 4k 解析度 建議只在確認構圖滿意後再升解析度,先用 1K 調好 prompt。
第六步:實用 prompt 技巧
風格控制:在 prompt 末尾加風格關鍵詞
一座現代化圖書館內部,大量自然光,暖色調 —— 攝影風格,85mm 鏡頭,淺景深
細節描述:從前景到背景分層描述
前景:一杯冒著熱氣的拿鐵咖啡
中景:木質桌面,筆記型電腦半開著
背景:落地窗外的城市雪景,虛化處理
整體風格:INS 風,高飽和度,自然光
負向提示(排除不想要的元素):
/image 一個現代感的 App 介面截圖,乾淨的 UI 設計 --negative 文字模糊,低解析度,扭曲變形
第七步:批量生成多張圖片對比選擇
一次生成多個版本便於對比:
幫我生成 4 個版本的品牌 Logo 方案,主題是「AI + 海洋」,風格各有差異
或者指定數量:
/image --count 4 --resolution 1k 極簡科技感圖示,圓形背景,不同配色方案
openclaw 圖片輸入輸出 image-to-image 可以進一步對批量結果中最滿意的一張做二次編輯細化。
常見問題
OpenClaw 能免費生成圖片嗎?
OpenClaw 本身是自託管的開源框架,Nano Banana Pro Skill 的圖像生成調用底層的 Gemini 圖像模型介面。如果你使用的是 Google AI Studio 的免費配額,在配額範圍內生成 1K/2K 圖片是免費的。超出免費配額後按 Gemini API 的標準計費,通常 1K 圖片約 $0.003/張,遠低於 Midjourney 訂閱費用。建議在 OpenClaw 配置檔案中設定月度用量上限,避免意外超支。
Nano Banana Pro 和 Midjourney 有什麼區別?
Nano Banana Pro 的核心優勢是整合在 OpenClaw 的對話流程中,你可以在同一個對話裡完成「搜尋參考圖 → 生成 → 編輯 → 儲存到 Notion」這樣的完整工作流,不需要在多個工具間切換。Midjourney 在圖像品質和藝術風格上目前略有優勢,但它需要通過 Discord 操作,不支援程式化調用。如果你的主要需求是批量生成、自動化工作流、圖片編輯,Nano Banana Pro 更適合。
生成的圖片有版權嗎?
根據 Google Gemini 的服務條款,通過 API 生成的圖片版權歸使用者所有,可用於商業用途。但生成包含真實人物面孔、知名商標或受版權保護的藝術風格(如「宮崎駿風格」)時,存在法律灰色地帶,商業使用前建議諮詢法律意見。生成的圖片不得用於違法內容,Gemini API 內建了安全過濾器,會自動拒絕違規請求。
image-to-image 可以做哪些類型的編輯?
image-to-image 支援的編輯類型包括:背景替換(去背景/換背景)、風格遷移(把照片轉成油畫/水彩/漫畫風)、局部修改(用自然語言描述要改的區域)、圖片修復(去除浮水印、填充缺失區域)、顏色調整(改變特定區域的顏色)。對於精細的局部編輯,建議在 prompt 中盡量清晰地描述「哪個區域」做「什麼改動」,模型會盡量保留未描述的區域不變。