教程 04

教程 04 — 瀏覽器自動化:讓 AI 幫你操控網頁

目標:使用 OpenClaw 內建的瀏覽器工具,讓 AI 自動瀏覽網頁、截圖、提取資訊、填寫表單。


原理

OpenClaw 整合了一個專用的 Chrome/Chromium 實例,AI 可以通過工具調用來:

  • 導航到指定 URL
  • 截圖並分析頁面
  • 點擊元素、填寫表單
  • 提取結構化資料
你的指令 → AI → browser_navigate / browser_action → Chrome → 截圖/結果 → AI 分析 → 回覆

前置條件

確保 Chrome 或 Chromium 已安裝:

# macOS
brew install --cask google-chrome
 
# 或者使用 Chromium
brew install --cask chromium

基礎用法:讓 AI 抓取網頁資訊

在 WebChat 或 Telegram 中直接描述任務:

示例 1:查看天氣

幫我打開 https://wttr.in/Shanghai 截圖,告訴我上海今天天氣

示例 2:抓取 GitHub 倉庫資訊

幫我打開 https://github.com/trending,列出今天 GitHub 上最熱門的 5 個專案,包括語言和 star 數

示例 3:讀取線上文件

打開 https://docs.python.org/3/library/asyncio.html,給我總結 asyncio 最常用的 5 個函數

進階:表單自動填寫

幫我打開 https://httpbin.org/forms/post
填寫以下資訊:
- custname: 張三
- custtel: 13800138000
- custemail: zhangsan@example.com
- comments: 這是一個測試訂單

然後截圖給我看結果

進階:批量資料提取

結合自定義 Skill,建立一個資料採集技能:

~/.openclaw/workspace/skills/數據採集/SKILL.md:

# 網頁資料採集專家
 
使用者會提供一個網址和需要提取的資料欄位。你需要:
 
1. 使用 browser_navigate 打開頁面
2. 使用 browser_snapshot 取得頁面內容
3. 按使用者要求提取結構化資料
4. 以 JSON 或 Markdown 表格格式輸出
 
注意:
- 如果頁面需要滾動,分多次截圖
- 如果有分頁,詢問使用者是否需要翻頁採集
- 遇到登入牆時告知使用者

使用:

/數據採集

網址:https://news.ycombinator.com
需要提取:標題、連結、分數、評論數(前 10 條)

進階:監控網頁變化

結合 Cron 定時任務(需配置 cron 頻道),可以定期檢查網頁:

{
  "channels": {
    "cron": {
      "enabled": true,
      "jobs": [
        {
          "cron": "0 9 * * 1-5",
          "message": "打開 https://github.com/trending 截圖,總結今日熱門專案並發給我",
          "channel": "telegram"
        }
      ]
    }
  }
}

這樣每個工作日早上 9 點,AI 會自動爬取 GitHub Trending 並通過 Telegram 發給你。


工具一覽

AI 在瀏覽器任務中可以使用的工具:

工具 功能
browser_navigate 打開 URL
browser_snapshot 截圖當前頁面
browser_action 點擊、輸入、滾動等操作
browser_upload 上傳檔案到頁面

注意事項

  • 瀏覽器工具在沙盒模式下運行,不會影響你日常使用的瀏覽器
  • 不要用於登入涉及敏感帳號的網站(AI 會看到截圖內容)
  • 複雜 SPA 頁面(如 React/Vue 應用)可能需要等待載入,可以在指令裡說明

常見問題

需要額外安裝 ChromeDriver 或 Selenium 嗎?

不需要。OpenClaw 使用 Playwright 內核直接控制 Chrome/Chromium,無需手動安裝 ChromeDriver。你只需確保 Chrome 或 Chromium 已安裝在系統中即可,其他都由 OpenClaw 自動處理。

瀏覽器任務失敗了怎麼調試?

在指令中加上「截圖給我看」,AI 會在關鍵步驟截圖彙報進度,方便你判斷卡在哪裡。也可以查看網關日誌:tail -f /tmp/openclaw/openclaw-$(date +%Y-%m-%d).log | grep browser,查看詳細的工具調用記錄。

能訪問需要登入的網站嗎?

可以,但需要注意安全:AI 會看到頁面截圖中的所有內容,包括帳號密碼輸入框和隱私資料。建議只在自己控制的網站上做登入自動化,不要用於銀行、支付等敏感帳號。

能處理 React/Vue 等動態載入的 SPA 頁面嗎?

可以,但需要在指令中說明等待時機,例如:「打開頁面後等待 3 秒再截圖」,或「等到頁面載入完成再提取資料」。AI 會使用 browser_action 執行等待操作。對於需要滾動載入的頁面,可以告訴 AI 「向下滾動 3 次後截圖」。

瀏覽器自動化會影響我正在用的 Chrome 嗎?

不會。OpenClaw 啟動的是一個獨立的 Chromium 實例(無頭模式),和你日常使用的瀏覽器完全隔離,Cookie、帳號狀態互不影響。


下一步

  • 教程 05 — 配置多個模型,Claude 貴了自動切 MiniMax

关注我们,获取最新 AI 动态

在 X 上关注 @lanmiaoai,第一时间获取教程更新、AI 工具推荐。

立即关注