Tutoriels 04

Tutoriel 04 — Automatisation du navigateur : laissez l'IA piloter les pages web

Objectif : utiliser les outils navigateur intégrés d'OpenClaw pour laisser l'IA naviguer automatiquement, prendre des captures d'écran, extraire des informations et remplir des formulaires.


Principe de fonctionnement

OpenClaw intègre une instance Chrome/Chromium dédiée. L'IA peut y effectuer des appels d'outils pour :

  • Naviguer vers une URL
  • Prendre des captures d'écran et analyser la page
  • Cliquer sur des éléments, remplir des formulaires
  • Extraire des données structurées
Votre instruction → IA → browser_navigate / browser_action → Chrome → Capture/Résultat → Analyse IA → Réponse

Prérequis

Assurez-vous que Chrome ou Chromium est installé :

# macOS
brew install --cask google-chrome
 
# Ou avec Chromium
brew install --cask chromium

Usage de base : extraire des informations d'une page web

Décrivez simplement la tâche dans WebChat ou Telegram :

Exemple 1 : Consulter la météo

Ouvre https://wttr.in/Paris, prends une capture d'écran et dis-moi la météo de Paris aujourd'hui

Exemple 2 : Récupérer des informations sur des dépôts GitHub

Ouvre https://github.com/trending et liste les 5 projets les plus populaires aujourd'hui sur GitHub, avec le langage et le nombre de stars

Exemple 3 : Lire une documentation en ligne

Ouvre https://docs.python.org/3/library/asyncio.html et résume-moi les 5 fonctions asyncio les plus utilisées

Avancé : remplissage automatique de formulaires

Ouvre https://httpbin.org/forms/post
Remplis les informations suivantes :
- custname: Jean Dupont
- custtel: 0612345678
- custemail: jean.dupont@exemple.fr
- comments: Ceci est une commande de test

Puis prends une capture d'écran pour me montrer le résultat

Avancé : extraction de données en masse

Combinez avec un Skill personnalisé pour créer une compétence de collecte de données :

~/.openclaw/workspace/skills/collecte-données/SKILL.md :

# Expert en collecte de données web
 
L'utilisateur fournit une URL et les champs à extraire. Vous devez :
 
1. Utiliser browser_navigate pour ouvrir la page
2. Utiliser browser_snapshot pour récupérer le contenu
3. Extraire les données structurées selon la demande
4. Les présenter au format JSON ou tableau Markdown
 
Remarques :
- Si la page nécessite un défilement, prenez plusieurs captures
- En cas de pagination, demandez à l'utilisateur s'il faut parcourir les pages
- Signalez à l'utilisateur si une mur de connexion est détecté

Utilisation :

/collecte-données

URL : https://news.ycombinator.com
À extraire : titre, lien, score, nombre de commentaires (10 premiers résultats)

Avancé : surveiller les changements d'une page web

En combinant avec des tâches cron (nécessite la configuration du canal cron), vous pouvez vérifier périodiquement une page :

{
  "channels": {
    "cron": {
      "enabled": true,
      "jobs": [
        {
          "cron": "0 9 * * 1-5",
          "message": "Ouvre https://github.com/trending, prends une capture et envoie-moi un résumé des projets tendance du jour",
          "channel": "telegram"
        }
      ]
    }
  }
}

Ainsi, chaque matin en semaine à 9h, l'IA consulte automatiquement GitHub Trending et vous l'envoie via Telegram.


Aperçu des outils

Outils disponibles pour les tâches navigateur :

Outil Fonction
browser_navigate Ouvrir une URL
browser_snapshot Capture d'écran de la page courante
browser_action Cliquer, saisir, faire défiler, etc.
browser_upload Téléverser un fichier vers une page

Précautions

  • Les outils navigateur s'exécutent en mode bac à sable et n'affectent pas votre navigateur habituel
  • Évitez de les utiliser pour vous connecter à des sites sensibles (l'IA voit le contenu des captures)
  • Les SPA complexes (React/Vue) peuvent nécessiter un temps de chargement — précisez-le dans vos instructions

Questions fréquentes

Faut-il installer ChromeDriver ou Selenium ?

Non. OpenClaw utilise le noyau Playwright pour piloter directement Chrome/Chromium — aucune installation manuelle de ChromeDriver n'est requise. Il suffit que Chrome ou Chromium soit installé sur le système ; OpenClaw gère tout le reste automatiquement.

Comment déboguer une tâche navigateur qui échoue ?

Ajoutez « prends une capture d'écran » à vos instructions — l'IA fera une capture à chaque étape clé pour vous aider à identifier le blocage. Vous pouvez aussi consulter les logs : tail -f /tmp/openclaw/openclaw-$(date +%Y-%m-%d).log | grep browser.

Peut-on accéder aux sites nécessitant une connexion ?

Oui, mais soyez vigilant : l'IA voit tout le contenu des captures, y compris les champs de saisie de mot de passe et les données privées. Réservez l'automatisation de connexion aux sites que vous contrôlez — évitez les comptes bancaires ou de paiement.

Peut-on traiter des SPA dynamiques (React/Vue) ?

Oui, mais précisez les temps d'attente dans vos instructions, par exemple : « ouvre la page et attends 3 secondes avant de prendre la capture » ou « attends que la page soit chargée avant d'extraire les données ». L'IA utilisera browser_action pour gérer l'attente.

L'automatisation du navigateur affecte-t-elle mon Chrome habituel ?

Non. OpenClaw démarre une instance Chromium indépendante (mode sans interface), complètement isolée de votre navigateur habituel — cookies et comptes ne sont pas partagés.


Prochaines étapes

  • Tutoriel 05 — Configurer plusieurs modèles : basculer automatiquement vers MiniMax quand Claude coûte trop cher

关注我们,获取最新 AI 动态

在 X 上关注 @lanmiaoai,第一时间获取教程更新、AI 工具推荐。

立即关注