Tutoriel 04 — Automatisation du navigateur : laissez l'IA piloter les pages web
Objectif : utiliser les outils navigateur intégrés d'OpenClaw pour laisser l'IA naviguer automatiquement, prendre des captures d'écran, extraire des informations et remplir des formulaires.
Principe de fonctionnement
OpenClaw intègre une instance Chrome/Chromium dédiée. L'IA peut y effectuer des appels d'outils pour :
- Naviguer vers une URL
- Prendre des captures d'écran et analyser la page
- Cliquer sur des éléments, remplir des formulaires
- Extraire des données structurées
Votre instruction → IA → browser_navigate / browser_action → Chrome → Capture/Résultat → Analyse IA → Réponse
Prérequis
Assurez-vous que Chrome ou Chromium est installé :
# macOS
brew install --cask google-chrome
# Ou avec Chromium
brew install --cask chromiumUsage de base : extraire des informations d'une page web
Décrivez simplement la tâche dans WebChat ou Telegram :
Exemple 1 : Consulter la météo
Ouvre https://wttr.in/Paris, prends une capture d'écran et dis-moi la météo de Paris aujourd'hui
Exemple 2 : Récupérer des informations sur des dépôts GitHub
Ouvre https://github.com/trending et liste les 5 projets les plus populaires aujourd'hui sur GitHub, avec le langage et le nombre de stars
Exemple 3 : Lire une documentation en ligne
Ouvre https://docs.python.org/3/library/asyncio.html et résume-moi les 5 fonctions asyncio les plus utilisées
Avancé : remplissage automatique de formulaires
Ouvre https://httpbin.org/forms/post
Remplis les informations suivantes :
- custname: Jean Dupont
- custtel: 0612345678
- custemail: jean.dupont@exemple.fr
- comments: Ceci est une commande de test
Puis prends une capture d'écran pour me montrer le résultat
Avancé : extraction de données en masse
Combinez avec un Skill personnalisé pour créer une compétence de collecte de données :
~/.openclaw/workspace/skills/collecte-données/SKILL.md :
# Expert en collecte de données web
L'utilisateur fournit une URL et les champs à extraire. Vous devez :
1. Utiliser browser_navigate pour ouvrir la page
2. Utiliser browser_snapshot pour récupérer le contenu
3. Extraire les données structurées selon la demande
4. Les présenter au format JSON ou tableau Markdown
Remarques :
- Si la page nécessite un défilement, prenez plusieurs captures
- En cas de pagination, demandez à l'utilisateur s'il faut parcourir les pages
- Signalez à l'utilisateur si une mur de connexion est détectéUtilisation :
/collecte-données
URL : https://news.ycombinator.com
À extraire : titre, lien, score, nombre de commentaires (10 premiers résultats)
Avancé : surveiller les changements d'une page web
En combinant avec des tâches cron (nécessite la configuration du canal cron), vous pouvez vérifier périodiquement une page :
{
"channels": {
"cron": {
"enabled": true,
"jobs": [
{
"cron": "0 9 * * 1-5",
"message": "Ouvre https://github.com/trending, prends une capture et envoie-moi un résumé des projets tendance du jour",
"channel": "telegram"
}
]
}
}
}Ainsi, chaque matin en semaine à 9h, l'IA consulte automatiquement GitHub Trending et vous l'envoie via Telegram.
Aperçu des outils
Outils disponibles pour les tâches navigateur :
| Outil | Fonction |
|---|---|
browser_navigate |
Ouvrir une URL |
browser_snapshot |
Capture d'écran de la page courante |
browser_action |
Cliquer, saisir, faire défiler, etc. |
browser_upload |
Téléverser un fichier vers une page |
Précautions
- Les outils navigateur s'exécutent en mode bac à sable et n'affectent pas votre navigateur habituel
- Évitez de les utiliser pour vous connecter à des sites sensibles (l'IA voit le contenu des captures)
- Les SPA complexes (React/Vue) peuvent nécessiter un temps de chargement — précisez-le dans vos instructions
Questions fréquentes
Faut-il installer ChromeDriver ou Selenium ?
Non. OpenClaw utilise le noyau Playwright pour piloter directement Chrome/Chromium — aucune installation manuelle de ChromeDriver n'est requise. Il suffit que Chrome ou Chromium soit installé sur le système ; OpenClaw gère tout le reste automatiquement.
Comment déboguer une tâche navigateur qui échoue ?
Ajoutez « prends une capture d'écran » à vos instructions — l'IA fera une capture à chaque étape clé pour vous aider à identifier le blocage. Vous pouvez aussi consulter les logs : tail -f /tmp/openclaw/openclaw-$(date +%Y-%m-%d).log | grep browser.
Peut-on accéder aux sites nécessitant une connexion ?
Oui, mais soyez vigilant : l'IA voit tout le contenu des captures, y compris les champs de saisie de mot de passe et les données privées. Réservez l'automatisation de connexion aux sites que vous contrôlez — évitez les comptes bancaires ou de paiement.
Peut-on traiter des SPA dynamiques (React/Vue) ?
Oui, mais précisez les temps d'attente dans vos instructions, par exemple : « ouvre la page et attends 3 secondes avant de prendre la capture » ou « attends que la page soit chargée avant d'extraire les données ». L'IA utilisera browser_action pour gérer l'attente.
L'automatisation du navigateur affecte-t-elle mon Chrome habituel ?
Non. OpenClaw démarre une instance Chromium indépendante (mode sans interface), complètement isolée de votre navigateur habituel — cookies et comptes ne sont pas partagés.
Prochaines étapes
- Tutoriel 05 — Configurer plusieurs modèles : basculer automatiquement vers MiniMax quand Claude coûte trop cher