الدروس 19

الدرس 19 — دليل OpenClaw Nano Banana Pro: توليد وتحرير الصور بالذكاء الاصطناعي في المحادثة (مدعوم بـ Gemini، 2026)

الهدف: تثبيت مهارة Nano Banana Pro لجعل OpenClaw يولّد الصور ويحرّر الصور الموجودة بلغة طبيعية، مع دعم دقة 1K/2K/4K.


ما هو Nano Banana Pro؟

Nano Banana Pro مهارة صور من أكثر المهارات تنزيلاً على ClawHub (72 ألف تنزيل)، مدعومة بنموذج Google Gemini للصور، وتدعم وضعين: text-to-image (من نص إلى صورة) وimage-to-image (تحرير الصور). لا تحتاج تسجيلاً منفصلاً في Midjourney أو DALL-E، يمكن إنجاز الإبداع البصري مباشرةً من واجهة محادثة OpenClaw.


الخطوة الأولى: تثبيت أداة CLI التابعة

تعتمد مهارة Nano Banana Pro على أداة nano-banana-pro CLI. نفّذ في الطرفية:

npm install -g nano-banana-pro

للتحقق من التثبيت:

nano-banana-pro --version
# يجب أن يُخرج رقم الإصدار، مثل 2.4.1

في حالة خطأ في الصلاحيات، أضف sudo أو استخدم التثبيت العام عبر pnpm:

pnpm add -g nano-banana-pro

الخطوة الثانية: تثبيت المهارة

في WebChat أو Telegram أرسل:

/install @steipete/nano-banana-pro

للتحقق من نجاح التثبيت:

pnpm openclaw skills list
# يجب أن يظهر nano-banana-pro في القائمة

بعد التثبيت يتعرف OpenClaw تلقائياً على نية توليد الصور، دون إعداد إضافي لمفتاح API (يستخدم حصة Gemini المربوطة بـ OpenClaw).


الخطوة الثالثة: الاستخدام الأساسي لتوليد الصور (text-to-image)

صف الصورة التي تريدها بلغة طبيعية:

ولّد لي صورة: شوارع طوكيو بأسلوب سايبربانك، أضواء نيون تنعكس على الأرضية المبللة بعد المطر، أجواء ليلية

أو استخدم الأمر بشرطة مائلة:

/image قطة برتقالية جالسة على سحابة، بأسلوب رسوم متحركة Miyazaki، ألوان هادئة

أمثلة إضافية:

/image شعار تجاري بأسلوب minimalist، أسود وأبيض، بدون خلفية، مناسب للاستخدام التجاري
/image صورة عرض منتج تقني 2026: سماعات ذكية عائمة في الهواء، خلفية تدرج أرجواني أزرق متوهج

مثال على المخرجات: يعرض الذكاء الاصطناعي الصورة المولّدة مباشرةً في المحادثة مع رابط التنزيل ووقت التوليد.


الخطوة الرابعة: تحرير الصور (image-to-image)

لتعديل صورة موجودة، استخدم معامل --input-image:

عدّل هذه الصورة، غيّر الخلفية إلى بيضاء مع إبقاء العنصر الرئيسي كما هو: --input-image ~/Desktop/منتج.jpg

أو صف نية التعديل مباشرةً:

غيّر أسلوب هذه الصورة إلى رسم بالألوان المائية: ~/Downloads/صورة.png
احذف النصوص من هذه الصورة مع تعبئة الخلفية بشكل طبيعي
أضف شارة "جديد" على صورة المنتج هذه، خلفية حمراء ونص أبيض، في الزاوية العلوية اليمنى

جوهر تحرير الصور بأوامر الذكاء الاصطناعي هو وصف نية التعديل بلغة طبيعية، دون فتح Photoshop أو Figma.


الخطوة الخامسة: التحكم في الدقة (1K/2K/4K)

تحكم في حجم المخرجات عبر معامل --resolution:

# 1K (1024×1024) — معاينة سريعة، مناسبة للاختبار الأولي، أقل استهلاكاً للحصة
/image --resolution 1k منظر جوي للمدينة الليلية
 
# 2K (2048×2048) — توازن جيد للاستخدام اليومي، مناسبة للنشر في وسائل التواصل
/image --resolution 2k صورة دعائية للمنتج، خلفية بسيطة
 
# 4K (4096×4096) — جودة طباعة عالية، مناسبة للملصقات والأغلفة، تستهلك الحصة أكثر
/image --resolution 4k خلفية للمعرض، رؤية بانورامية طبيعية
الدقة حالات الاستخدام وقت التوليد استهلاك الحصة
1K اختبار سريع، الصور الرمزية ~5 ثوانٍ
2K وسائل التواصل، المواقع ~15 ثانية
4K الطباعة، المعارض ~45 ثانية

يُنصح بضبط الـ prompt على دقة 1K أولاً ثم الترقية لـ 4K عند الرضا عن التكوين.


الخطوة السادسة: تقنيات Prompt العملية

التحكم في الأسلوب: أضف كلمات مفتاحية للأسلوب في نهاية الـ prompt

مكتبة حديثة من الداخل، ضوء طبيعي وفير، ألوان دافئة — أسلوب تصويري، عدسة 85mm، عمق حقل ضيق

وصف التفاصيل: صف طبقةً تلو الأخرى من الأمام للخلف

المقدمة: كوب قهوة لاتيه يتصاعد منه البخار
المنتصف: طاولة خشبية، لابتوب نصف مفتوح
الخلفية: مشهد ثلوج المدينة من خلف نافذة أرضية، مبهم
الأسلوب الإجمالي: أسلوب Instagram، تشبع عالٍ، ضوء طبيعي

الـ Prompt السلبي (استبعاد العناصر غير المرغوبة):

/image لقطة شاشة لواجهة تطبيق عصري، تصميم UI نظيف --negative نص ضبابي,دقة منخفضة,تشوّه

الخطوة السابعة: التوليد الدفعي لمقارنة الخيارات

توليد نسخ متعددة دفعةً واحدة للمقارنة:

ولّد لي 4 مقترحات مختلفة لشعار العلامة التجارية بموضوع "الذكاء الاصطناعي + البحر" بأساليب متنوعة

أو حدد العدد:

/image --count 4 --resolution 1k أيقونة بأسلوب minimalist تقني، دائرية، ألوان مختلفة

يمكن تحرير الأفضل من النتائج الدفعية بشكل أدق عبر image-to-image.


الأسئلة الشائعة

هل يمكن توليد الصور بـ OpenClaw مجاناً؟

OpenClaw نفسه إطار مفتوح المصدر مستضاف ذاتياً، توليد الصور عبر مهارة Nano Banana Pro يستدعي واجهة نموذج Gemini للصور. إذا كنت تستخدم الحصة المجانية من Google AI Studio، فتوليد صور 1K/2K مجاني ضمن نطاق الحصة. بعد استنفاد الحصة المجانية تُطبَّق أسعار Gemini API القياسية، عادةً ~$0.003/صورة بدقة 1K، أقل بكثير من اشتراك Midjourney. يُنصح بتعيين حد شهري للاستهلاك في ملف إعداد OpenClaw لتجنب التجاوز غير المقصود.

ما الفرق بين Nano Banana Pro وMidjourney؟

الميزة الجوهرية لـ Nano Banana Pro هي التكامل في تدفق محادثة OpenClaw، يمكنك إنجاز سير عمل متكامل "بحث صور مرجعية → توليد → تحرير → حفظ في Notion" في نفس المحادثة دون التنقل بين أدوات متعددة. Midjourney يتفوق قليلاً حالياً في جودة الصورة والأسلوب الفني، لكنه يتطلب العمل عبر Discord ولا يدعم الاستدعاء البرمجي. إذا كان طلبك الأساسي التوليد الدفعي وأتمتة سير العمل وتحرير الصور، فـ Nano Banana Pro أنسب.

من يملك حقوق الصور المولّدة؟

وفقاً لشروط خدمة Google Gemini، الصور المولّدة عبر API ملك للمستخدم ويمكن استخدامها تجارياً. لكن توليد صور تحتوي وجوه أشخاص حقيقيين أو علامات تجارية معروفة أو أساليب فنية محمية (مثل "بأسلوب فلان") يقع في منطقة رمادية قانونياً، يُنصح باستشارة قانونية قبل الاستخدام التجاري. الصور المولّدة لا تُستخدم لأغراض غير مشروعة، وتحتوي Gemini API مرشّح أمان مدمجاً يرفض الطلبات المنتهكة.

ما أنواع التعديلات التي يدعمها image-to-image؟

يدعم: استبدال الخلفية (إزالة/تغيير الخلفية)، نقل الأسلوب (تحويل الصورة لرسم زيتي/مائي/كاريكاتير)، تعديل جزئي (صف المنطقة المراد تعديلها)، إصلاح الصور (إزالة العلامة المائية، تعبئة المناطق الناقصة)، تعديل الألوان. للتعديل الجزئي الدقيق يُنصح بوصف "أي منطقة" و"ما التعديل" بأكبر قدر من الوضوح في الـ prompt، والنموذج سيحاول الإبقاء على المناطق غير الموصوفة دون تغيير.


الخطوات التالية

  • الدرس 20 — تثبيت مهارة Obsidian لحفظ الصور المولّدة ومسار الإبداع تلقائياً في Obsidian
  • الدرس 11 — استخدام Skill Vetter للفحص الأمني قبل التثبيت

关注我们,获取最新 AI 动态

在 X 上关注 @lanmiaoai,第一时间获取教程更新、AI 工具推荐。

立即关注