教程 19

教程 19 — OpenClaw Nano Banana Pro 教程:對話式 AI 文生圖與圖片編輯(Gemini 驅動,2026)

目標:安裝 Nano Banana Pro Skill,讓 OpenClaw 通過自然語言生成圖片、編輯現有圖片,支援 1K/2K/4K 解析度。


什麼是 Nano Banana Pro?

Nano Banana Pro 是 ClawHub 下載量排名前列的圖像 Skill(72k 下載),底層由 Google Gemini 圖像模型驅動,支援 text-to-image(文生圖)image-to-image(圖片編輯) 兩種模式。不需要單獨註冊 Midjourney 或 DALL-E 帳號,通過 OpenClaw 的對話介面即可完成圖像創作。

SEO 關鍵詞覆蓋:openclaw ai 文生圖 免費 教程openclaw 生成圖片 4k 解析度nano banana pro gemini 圖像 2026


第一步:安裝依賴 CLI 工具

Nano Banana Pro 依賴 nano-banana-pro CLI。在終端執行:

npm install -g nano-banana-pro

驗證安裝:

nano-banana-pro --version
# 應該輸出版本號,如 2.4.1

如果遇到權限報錯,加 sudo 或改用 pnpm global 安裝:

pnpm add -g nano-banana-pro

第二步:安裝 Skill

在 WebChat 或 Telegram 中發送:

/install @steipete/nano-banana-pro

驗證安裝成功:

pnpm openclaw skills list
# 列表中應出現 nano-banana-pro

安裝後 OpenClaw 會自動識別圖像生成意圖,無需額外配置 API Key(使用 OpenClaw 已綁定的 Gemini 配額)。


第三步:文生圖基礎用法(text-to-image)

直接用自然語言描述你想要的圖片:

幫我生成一張圖:賽博朋克風格的東京街頭,霓虹燈反射在雨後的地面,夜晚氛圍

或者使用斜線命令:

/image 一隻坐在雲朵上的橘貓,宮崎駿動畫風格,柔和配色

更多 prompt 示例:

/image 極簡主義風格的咖啡品牌 Logo,黑白配色,無背景,適合商業使用
/image 2026 年科技感產品展示圖:懸浮在空中的智慧耳機,背景是漸變紫藍色光暈

輸出示例:AI 會直接在對話中展示生成的圖片,並附上下載連結和生成耗時。


第四步:圖片編輯(image-to-image)

如果你需要修改現有圖片,使用 --input-image 參數傳入原圖:

修改這張圖片,把背景改成白色,保留主體不變:--input-image ~/Desktop/product.jpg

或者直接描述編輯意圖:

把這張照片的風格改成水彩畫:~/Downloads/photo.png
幫我把圖片裡的文字去掉,保持背景自然填充
給這張產品圖加上「NEW」角標,紅色背景白色文字,放在右上角

openclaw 修改圖片 ai 指令操作 的核心就在於用自然語言描述編輯意圖,不需要打開 PS 或 Figma。


第五步:解析度控制(1K/2K/4K)

通過 --resolution 參數控制輸出尺寸:

# 1K(1024×1024)—— 快速預覽,適合原型測試,消耗配額最少
/image --resolution 1k 城市夜景俯視圖
 
# 2K(2048×2048)—— 日常使用的平衡點,適合社群媒體發布
/image --resolution 2k 產品宣傳圖,簡潔背景
 
# 4K(4096×4096)—— 高清印刷級別,適合海報、封面,消耗配額較多
/image --resolution 4k 展會主視覺背景圖,大氣磅礴的山水畫風格
解析度 適用場景 生成時間 配額消耗
1K 快速測試、頭像 ~5 秒
2K 社群媒體、網站 ~15 秒
4K 印刷、展覽 ~45 秒

openclaw 生成圖片 4k 解析度 建議只在確認構圖滿意後再升解析度,先用 1K 調好 prompt。


第六步:實用 prompt 技巧

風格控制:在 prompt 末尾加風格關鍵詞

一座現代化圖書館內部,大量自然光,暖色調 —— 攝影風格,85mm 鏡頭,淺景深

細節描述:從前景到背景分層描述

前景:一杯冒著熱氣的拿鐵咖啡
中景:木質桌面,筆記型電腦半開著
背景:落地窗外的城市雪景,虛化處理
整體風格:INS 風,高飽和度,自然光

負向提示(排除不想要的元素):

/image 一個現代感的 App 介面截圖,乾淨的 UI 設計 --negative 文字模糊,低解析度,扭曲變形

第七步:批量生成多張圖片對比選擇

一次生成多個版本便於對比:

幫我生成 4 個版本的品牌 Logo 方案,主題是「AI + 海洋」,風格各有差異

或者指定數量:

/image --count 4 --resolution 1k 極簡科技感圖示,圓形背景,不同配色方案

openclaw 圖片輸入輸出 image-to-image 可以進一步對批量結果中最滿意的一張做二次編輯細化。


常見問題

OpenClaw 能免費生成圖片嗎?

OpenClaw 本身是自託管的開源框架,Nano Banana Pro Skill 的圖像生成調用底層的 Gemini 圖像模型介面。如果你使用的是 Google AI Studio 的免費配額,在配額範圍內生成 1K/2K 圖片是免費的。超出免費配額後按 Gemini API 的標準計費,通常 1K 圖片約 $0.003/張,遠低於 Midjourney 訂閱費用。建議在 OpenClaw 配置檔案中設定月度用量上限,避免意外超支。

Nano Banana Pro 和 Midjourney 有什麼區別?

Nano Banana Pro 的核心優勢是整合在 OpenClaw 的對話流程中,你可以在同一個對話裡完成「搜尋參考圖 → 生成 → 編輯 → 儲存到 Notion」這樣的完整工作流,不需要在多個工具間切換。Midjourney 在圖像品質和藝術風格上目前略有優勢,但它需要通過 Discord 操作,不支援程式化調用。如果你的主要需求是批量生成、自動化工作流、圖片編輯,Nano Banana Pro 更適合。

生成的圖片有版權嗎?

根據 Google Gemini 的服務條款,通過 API 生成的圖片版權歸使用者所有,可用於商業用途。但生成包含真實人物面孔、知名商標或受版權保護的藝術風格(如「宮崎駿風格」)時,存在法律灰色地帶,商業使用前建議諮詢法律意見。生成的圖片不得用於違法內容,Gemini API 內建了安全過濾器,會自動拒絕違規請求。

image-to-image 可以做哪些類型的編輯?

image-to-image 支援的編輯類型包括:背景替換(去背景/換背景)、風格遷移(把照片轉成油畫/水彩/漫畫風)、局部修改(用自然語言描述要改的區域)、圖片修復(去除浮水印、填充缺失區域)、顏色調整(改變特定區域的顏色)。對於精細的局部編輯,建議在 prompt 中盡量清晰地描述「哪個區域」做「什麼改動」,模型會盡量保留未描述的區域不變。


下一步

  • 教程 20 — 安裝 Obsidian Skill,把生成的圖片和創作過程自動存進 Obsidian 筆記
  • 教程 11 — 安裝前先用 Skill Vetter 做安全檢查

关注我们,获取最新 AI 动态

在 X 上关注 @lanmiaoai,第一时间获取教程更新、AI 工具推荐。

立即关注