教程 04 — 瀏覽器自動化:讓 AI 幫你操控網頁
目標:使用 OpenClaw 內建的瀏覽器工具,讓 AI 自動瀏覽網頁、截圖、提取資訊、填寫表單。
原理
OpenClaw 整合了一個專用的 Chrome/Chromium 實例,AI 可以通過工具調用來:
- 導航到指定 URL
- 截圖並分析頁面
- 點擊元素、填寫表單
- 提取結構化資料
你的指令 → AI → browser_navigate / browser_action → Chrome → 截圖/結果 → AI 分析 → 回覆
前置條件
確保 Chrome 或 Chromium 已安裝:
# macOS
brew install --cask google-chrome
# 或者使用 Chromium
brew install --cask chromium基礎用法:讓 AI 抓取網頁資訊
在 WebChat 或 Telegram 中直接描述任務:
示例 1:查看天氣
幫我打開 https://wttr.in/Shanghai 截圖,告訴我上海今天天氣
示例 2:抓取 GitHub 倉庫資訊
幫我打開 https://github.com/trending,列出今天 GitHub 上最熱門的 5 個專案,包括語言和 star 數
示例 3:讀取線上文件
打開 https://docs.python.org/3/library/asyncio.html,給我總結 asyncio 最常用的 5 個函數
進階:表單自動填寫
幫我打開 https://httpbin.org/forms/post
填寫以下資訊:
- custname: 張三
- custtel: 13800138000
- custemail: zhangsan@example.com
- comments: 這是一個測試訂單
然後截圖給我看結果
進階:批量資料提取
結合自定義 Skill,建立一個資料採集技能:
~/.openclaw/workspace/skills/數據採集/SKILL.md:
# 網頁資料採集專家
使用者會提供一個網址和需要提取的資料欄位。你需要:
1. 使用 browser_navigate 打開頁面
2. 使用 browser_snapshot 取得頁面內容
3. 按使用者要求提取結構化資料
4. 以 JSON 或 Markdown 表格格式輸出
注意:
- 如果頁面需要滾動,分多次截圖
- 如果有分頁,詢問使用者是否需要翻頁採集
- 遇到登入牆時告知使用者使用:
/數據採集
網址:https://news.ycombinator.com
需要提取:標題、連結、分數、評論數(前 10 條)
進階:監控網頁變化
結合 Cron 定時任務(需配置 cron 頻道),可以定期檢查網頁:
{
"channels": {
"cron": {
"enabled": true,
"jobs": [
{
"cron": "0 9 * * 1-5",
"message": "打開 https://github.com/trending 截圖,總結今日熱門專案並發給我",
"channel": "telegram"
}
]
}
}
}這樣每個工作日早上 9 點,AI 會自動爬取 GitHub Trending 並通過 Telegram 發給你。
工具一覽
AI 在瀏覽器任務中可以使用的工具:
| 工具 | 功能 |
|---|---|
browser_navigate |
打開 URL |
browser_snapshot |
截圖當前頁面 |
browser_action |
點擊、輸入、滾動等操作 |
browser_upload |
上傳檔案到頁面 |
注意事項
- 瀏覽器工具在沙盒模式下運行,不會影響你日常使用的瀏覽器
- 不要用於登入涉及敏感帳號的網站(AI 會看到截圖內容)
- 複雜 SPA 頁面(如 React/Vue 應用)可能需要等待載入,可以在指令裡說明
常見問題
需要額外安裝 ChromeDriver 或 Selenium 嗎?
不需要。OpenClaw 使用 Playwright 內核直接控制 Chrome/Chromium,無需手動安裝 ChromeDriver。你只需確保 Chrome 或 Chromium 已安裝在系統中即可,其他都由 OpenClaw 自動處理。
瀏覽器任務失敗了怎麼調試?
在指令中加上「截圖給我看」,AI 會在關鍵步驟截圖彙報進度,方便你判斷卡在哪裡。也可以查看網關日誌:tail -f /tmp/openclaw/openclaw-$(date +%Y-%m-%d).log | grep browser,查看詳細的工具調用記錄。
能訪問需要登入的網站嗎?
可以,但需要注意安全:AI 會看到頁面截圖中的所有內容,包括帳號密碼輸入框和隱私資料。建議只在自己控制的網站上做登入自動化,不要用於銀行、支付等敏感帳號。
能處理 React/Vue 等動態載入的 SPA 頁面嗎?
可以,但需要在指令中說明等待時機,例如:「打開頁面後等待 3 秒再截圖」,或「等到頁面載入完成再提取資料」。AI 會使用 browser_action 執行等待操作。對於需要滾動載入的頁面,可以告訴 AI 「向下滾動 3 次後截圖」。
瀏覽器自動化會影響我正在用的 Chrome 嗎?
不會。OpenClaw 啟動的是一個獨立的 Chromium 實例(無頭模式),和你日常使用的瀏覽器完全隔離,Cookie、帳號狀態互不影響。
下一步
- 教程 05 — 配置多個模型,Claude 貴了自動切 MiniMax