الدروس 04

الدرس 04 — أتمتة المتصفح: دع الذكاء الاصطناعي يتحكم في صفحات الويب

الهدف: استخدام أدوات المتصفح المضمّنة في OpenClaw لجعل الذكاء الاصطناعي يتصفح الويب تلقائياً، ويلتقط لقطات الشاشة، ويستخرج المعلومات، ويملأ النماذج.


كيف يعمل

يدمج OpenClaw نسخة مخصصة من Chrome/Chromium، ويمكن للذكاء الاصطناعي من خلال استدعاء الأدوات:

  • التنقل إلى رابط URL محدد
  • التقاط لقطات الشاشة وتحليل الصفحات
  • النقر على العناصر وملء النماذج
  • استخراج البيانات المنظمة
أمرك → الذكاء الاصطناعي → browser_navigate / browser_action → Chrome → لقطة الشاشة/النتيجة → تحليل الذكاء الاصطناعي → الرد

المتطلبات الأساسية

تأكد من تثبيت Chrome أو Chromium:

# macOS
brew install --cask google-chrome
 
# أو استخدم Chromium
brew install --cask chromium

الاستخدام الأساسي: استخراج معلومات من الويب

اصف المهمة مباشرةً في WebChat أو Telegram:

مثال 1: التحقق من الطقس

افتح https://wttr.in/Dubai والتقط لقطة شاشة، وأخبرني بطقس دبي اليوم

مثال 2: استخراج معلومات مستودعات GitHub

افتح https://github.com/trending، وأدرج أكثر 5 مشاريع رواجاً على GitHub اليوم مع اللغة البرمجية وعدد النجوم

مثال 3: قراءة الوثائق الإلكترونية

افتح https://docs.python.org/3/library/asyncio.html، ولخّص لي أكثر 5 دوال استخداماً في asyncio

متقدم: ملء النماذج تلقائياً

افتح https://httpbin.org/forms/post
املأ المعلومات التالية:
- custname: أحمد
- custtel: 00971501234567
- custemail: ahmed@example.com
- comments: هذا طلب اختباري

ثم التقط لقطة شاشة لأرى النتيجة

متقدم: استخراج البيانات بالجملة

ادمج مهارة مخصصة لإنشاء مهارة جمع البيانات:

~/.openclaw/workspace/skills/جمع_البيانات/SKILL.md:

# خبير جمع بيانات الويب
 
سيقدم المستخدم رابطاً وحقول البيانات المطلوبة. عليك:
 
1. استخدام browser_navigate لفتح الصفحة
2. استخدام browser_snapshot للحصول على محتوى الصفحة
3. استخراج البيانات المنظمة وفق متطلبات المستخدم
4. الإخراج بتنسيق JSON أو جدول Markdown
 
ملاحظات:
- إذا احتاجت الصفحة للتمرير، التقط لقطات متعددة
- إذا كان هناك ترقيم صفحات، اسأل المستخدم عن الحاجة للمتابعة
- أخبر المستخدم إذا واجهت جدار تسجيل دخول

الاستخدام:

/جمع_البيانات

الرابط: https://news.ycombinator.com
البيانات المطلوبة: العنوان، الرابط، النقاط، عدد التعليقات (أول 10 عناصر)

متقدم: مراقبة تغيّرات الويب

مع مهام Cron المجدولة (تتطلب إعداد قناة cron)، يمكنك التحقق الدوري من الصفحات:

{
  "channels": {
    "cron": {
      "enabled": true,
      "jobs": [
        {
          "cron": "0 9 * * 1-5",
          "message": "افتح https://github.com/trending والتقط لقطة شاشة، وأرسل لي ملخص المشاريع الأكثر رواجاً اليوم",
          "channel": "telegram"
        }
      ]
    }
  }
}

بهذا يقوم الذكاء الاصطناعي كل صباح في أيام العمل الساعة 9 بجمع بيانات GitHub Trending وإرسالها إليك عبر Telegram.


نظرة عامة على الأدوات

الأدوات التي يمكن للذكاء الاصطناعي استخدامها في مهام المتصفح:

الأداة الوظيفة
browser_navigate فتح رابط URL
browser_snapshot التقاط لقطة الصفحة الحالية
browser_action النقر والإدخال والتمرير وغيرها
browser_upload رفع ملف إلى الصفحة

تنبيهات مهمة

  • تعمل أدوات المتصفح في وضع sandbox ولا تؤثر على متصفحك اليومي
  • لا تستخدمها لتسجيل الدخول إلى مواقع تحتوي على حسابات حساسة (الذكاء الاصطناعي يرى محتوى لقطة الشاشة)
  • قد تحتاج الصفحات المعقدة من نوع SPA (React/Vue) إلى انتظار التحميل، يمكنك الإشارة إلى ذلك في التعليمات

الأسئلة الشائعة

هل أحتاج لتثبيت ChromeDriver أو Selenium بشكل منفصل؟

لا. يستخدم OpenClaw محرك Playwright للتحكم المباشر في Chrome/Chromium، دون الحاجة لتثبيت ChromeDriver يدوياً. تحتاج فقط للتأكد من تثبيت Chrome أو Chromium في النظام، وسيتولى OpenClaw الباقي تلقائياً.

كيف أصحح مشاكل مهام المتصفح الفاشلة؟

أضف عبارة "التقط لقطة شاشة وأرني" في تعليماتك، وسيلتقط الذكاء الاصطناعي لقطات في الخطوات الرئيسية لمساعدتك على تحديد مكان المشكلة. يمكنك أيضاً مراجعة سجلات البوابة: tail -f /tmp/openclaw/openclaw-$(date +%Y-%m-%d).log | grep browser.

هل يمكن الوصول إلى مواقع تتطلب تسجيل الدخول؟

نعم، لكن انتبه للأمان: الذكاء الاصطناعي يرى كل محتوى لقطة الشاشة بما في ذلك حقول كلمة المرور والبيانات الخاصة. يُنصح بأتمتة تسجيل الدخول فقط في المواقع التي تتحكم فيها، وتجنب استخدامها مع حسابات البنوك والدفع وما شابهها.

هل يمكن التعامل مع صفحات SPA الديناميكية مثل React/Vue؟

نعم، لكن يجب الإشارة إلى وقت الانتظار في التعليمات، مثلاً: "انتظر 3 ثوانٍ بعد فتح الصفحة قبل التقاط لقطة الشاشة"، أو "انتظر حتى تكتمل الصفحة ثم استخرج البيانات". سيستخدم الذكاء الاصطناعي browser_action لتنفيذ عمليات الانتظار. بالنسبة للصفحات التي تحتاج للتمرير لتحميل المحتوى، قل للذكاء الاصطناعي "انزل للأسفل 3 مرات ثم التقط لقطة".

هل تؤثر أتمتة المتصفح على Chrome الذي أستخدمه يومياً؟

لا. يُشغّل OpenClaw نسخة مستقلة من Chromium (في الوضع غير المرئي headless) معزولة تماماً عن متصفحك اليومي، ولا تتشارك cookies أو الحسابات.


الخطوات التالية

  • الدرس 05 — إعداد نماذج متعددة، التبديل التلقائي عند ارتفاع تكلفة Claude

关注我们,获取最新 AI 动态

在 X 上关注 @lanmiaoai,第一时间获取教程更新、AI 工具推荐。

立即关注