チュートリアル 19 — OpenClaw Nano Banana Proチュートリアル：会話型AI画像生成と画像編集（Gemini駆動、2026）

目標：Nano Banana Pro Skillをインストールして、OpenClawが自然言語で画像を生成し、既存の画像を編集できるようにします。1K/2K/4K解像度をサポート。

Nano Banana Proとは？

Nano Banana ProはClawHubで上位ランクの画像Skill（72k ダウンロード）で、底層はGoogle Gemini画像モデルで駆動され、**text-to-image（テキストから画像）とimage-to-image（画像から画像）**の2種類のモードをサポートします。MidjoureyやDALL-Eのアカウントを別途登録する必要がなく、OpenClawの会話インターフェースから画像創作を完成できます。

ステップ1：依存CLIツールのインストール

Nano Banana Proは nano-banana-pro CLIに依存しています。ターミナルで実行します：

npm install -g nano-banana-pro

インストールの確認：

nano-banana-pro --version
# バージョン番号が出力されるはずです。例：2.4.1

権限エラーが出た場合は、sudo を追加するかpnpm globalインストールを使います：

pnpm add -g nano-banana-pro

ステップ2：Skillのインストール

WebChatまたはTelegramで送信します：

/install @steipete/nano-banana-pro

インストール成功の確認：

pnpm openclaw skills list
# リストにnano-banana-proが表示されるはずです

インストール後、OpenClawは自動的に画像生成の意図を認識します。API Keyの追加設定は不要です（OpenClawにバインドされたGeminiのクォータを使用）。

ステップ3：テキストから画像の基本的な使い方（text-to-image）

自然言語で欲しい画像を直接説明します：

画像を生成してください：サイバーパンクスタイルの東京の街、ネオンライトが雨上がりの地面に反射している、夜の雰囲気

またはスラッシュコマンドを使います：

/image 雲の上に座っているオレンジ猫、宮崎駿アニメスタイル、ソフトな配色

その他のpromptの例：

/image ミニマリストスタイルのコーヒーブランドのロゴ、モノクロ配色、背景なし、商業使用に適合

/image 2026年のテクノロジー感のある製品展示図：空中に浮かぶスマートイヤホン、背景はグラデーションの紫青色の光暈

出力例：AIは会話内に生成した画像を直接表示し、ダウンロードリンクと生成時間を添付します。

ステップ4：画像編集（image-to-image）

既存の画像を修正する必要がある場合は、--input-image パラメータで元の画像を指定します：

この画像を修正してください。背景を白に変えて、被写体はそのままにしてください：--input-image ~/Desktop/product.jpg

または直接編集の意図を説明します：

この写真のスタイルを水彩画に変えてください：~/Downloads/photo.png
画像内の文字を消してください、背景は自然に塗りつぶしてください
この製品画像に「NEW」バッジを追加してください。赤い背景に白い文字、右上に配置

openclaw で画像を修正 AI指示操作のコアはまさに自然言語で編集の意図を説明することです。PhotoshopやFigmaを開く必要はありません。

ステップ5：解像度の制御（1K/2K/4K）

--resolution パラメータで出力サイズを制御します：

# 1K（1024×1024）—— 素早いプレビュー、プロトタイプテストに最適、クォータ消費最少
/image --resolution 1k 都市の夜景の俯瞰図
 
# 2K（2048×2048）—— 日常使用のバランス点、SNSへの投稿に適合
/image --resolution 2k 製品プロモーション画像、シンプルな背景
 
# 4K（4096×4096）—— 高精細な印刷品質、ポスター、カバーに適合、クォータ消費多め
/image --resolution 4k 展示会メインビジュアルの背景画像、壮大な山水画スタイル

解像度	適したシナリオ	生成時間	クォータ消費
1K	素早いテスト、アバター	約5秒	1×
2K	SNS、ウェブサイト	約15秒	3×
4K	印刷、展示会	約45秒	8×

openclaw で4K解像度の画像を生成する際は、構図に満足してから解像度を上げることをお勧めします。先に1Kでpromptを調整してください。

ステップ6：実用的なpromptのコツ

スタイルの制御：promptの末尾にスタイルのキーワードを追加

モダンな図書館の内部、大量の自然光、暖色系 —— 写真スタイル、85mmレンズ、浅い被写界深度

詳細の説明：前景から背景まで階層的に説明

前景：湯気の立つカフェラテ
中景：木製のテーブル、ノートパソコンが半開き
背景：落地窓の外の都市の雪景色、ぼかし処理
全体スタイル：INSスタイル、高彩度、自然光

ネガティブプロンプト（不要な要素を除外）：

/image モダンなアプリのUIスクリーンショット、クリーンなデザイン --negative ぼやけた文字,低解像度,歪み

ステップ7：複数枚を一括生成して比較

一度に複数バージョンを生成して比較しやすくします：

ブランドロゴのコンセプトを4つのバージョンで生成してください。テーマは「AI + 海」、スタイルはそれぞれ異なる

または数量を指定します：

/image --count 4 --resolution 1k ミニマリストテクノロジーアイコン、丸い背景、異なる配色

openclaw での画像入出力 image-to-imageでは、バッチ結果の中で最も気に入った一枚をさらに二次編集で細かく修正できます。

よくある質問

OpenClawは無料で画像を生成できますか？

OpenClaw自体はセルフホスト型のオープンソースフレームワークです。Nano Banana Pro SkillはGemini画像モデルインターフェースを呼び出します。Google AI Studioの無料クォータを使用している場合、クォータの範囲内での1K/2K画像生成は無料です。無料クォータを超えた場合はGemini APIの標準料金が適用されます。通常1K画像は約$0.003/枚で、Midjoureyのサブスクリプション費用よりずっと低いです。予期しない過剰支出を避けるため、OpenClawの設定ファイルで月次使用量の上限を設定することをお勧めします。

Nano Banana ProとMidjoureyの違いは何ですか？

Nano Banana ProのコアThe優位性はOpenClawの会話フローに統合されていることです。同じ会話内で「参考画像を検索 → 生成 → 編集 → Notionに保存」というような完全なワークフローを完成でき、複数のツールを切り替える必要がありません。MidjoureyはDiscordを通じて操作する必要があり、プログラム的な呼び出しをサポートしていません。主な要件がバッチ生成、自動化ワークフロー、画像編集であれば、Nano Banana Proの方が適しています。

生成した画像に著作権はありますか？

Google Geminiの利用規約によると、API経由で生成した画像の著作権はユーザーに帰属し、商業利用が可能です。ただし、実在の人物の顔、有名な商標、著作権で保護されたアートスタイル（「宮崎駿スタイル」など）を含む画像を生成する場合は法的なグレーゾーンが存在します。商業利用前には法的なアドバイスを求めることをお勧めします。生成画像は違法なコンテンツには使用できません。Gemini APIには組み込みの安全フィルターがあり、違反するリクエストは自動的に拒否されます。

image-to-imageはどのような種類の編集ができますか？

image-to-imageがサポートする編集の種類には以下が含まれます：背景の置き換え（背景を削除/変更）、スタイル転送（写真を油絵/水彩/漫画スタイルに変換）、部分的な修正（自然言語で変更したい領域を説明）、画像の修復（透かしを消す、欠けている部分を補填）、色の調整（特定の領域の色を変更）。細かな部分的な編集には、promptで「どの領域」に「どんな変更」をするか明確に説明することをお勧めします。モデルは説明されていない領域をできるだけ保持しようとします。

次のステップ

チュートリアル 20 — Obsidian Skillをインストールして、生成した画像と創作プロセスを自動的にObsidianのノートに保存する
チュートリアル 11 — インストール前にSkill Vetterでセキュリティチェックを行う