教程 10 — OpenClaw Summarize Skill 教程:一句话总结任意网页、PDF、YouTube 视频(2026)
目标:安装 Summarize Skill,让 OpenClaw 用一行指令总结任何网页、PDF 文档、YouTube 视频或音频文件。
什么是 Summarize Skill?
Summarize 是 ClawHub 下载量第二的 Skill(221k 下载),基于 summarize CLI 工具,支持以下内容类型:
| 内容类型 | 示例 |
|---|---|
| 网页 URL | 任意网页、新闻、技术文档 |
| PDF 文件 | 本地 PDF 或在线 PDF 链接 |
| YouTube 视频 | 自动提取字幕并总结 |
| 图片 | 截图、图表、扫描件 |
| 音频文件 | mp3、wav、会议录音 |
核心优势:不需要 API Key,基于 OpenClaw 已配置的模型运行,零额外成本。
第一步:安装依赖 CLI 工具
Summarize Skill 依赖 summarize CLI。先安装:
npm install -g @steipete/summarize-cli验证安装:
summarize --version
# 应该输出版本号,如 1.2.0第二步:安装 Skill
在 WebChat 或 Telegram 中发送:
/install @steipete/summarize
验证:
pnpm openclaw skills list
# 列表中应出现 summarize第三步:总结网页
发送任意 URL 并加上总结指令:
帮我总结这篇文章:https://example.com/article
或者使用斜杠命令:
/summarize https://example.com/article
输出示例:
核心观点
- OpenClaw 的 MCP 原生支持让它能接入 500+ 工具,是目前接入量最大的自托管 AI 框架
- 新版本将延迟降低了 40%,主要来自 gateway 层的优化
- 团队计划在 Q2 发布 Windows 原生支持
结论:这是一次重点针对开发者体验的版本更新,生产环境升级价值较高。
第四步:总结本地 PDF
把 PDF 路径传给 AI:
总结这份 PDF:~/Downloads/报告.pdf
或者总结在线 PDF(直接传 URL):
/summarize https://arxiv.org/pdf/2501.12345
适合的使用场景:
- 快速过一遍学术论文,判断是否值得精读
- 总结合同或报告的关键条款
- 把长篇技术文档压缩成行动要点
第五步:总结 YouTube 视频
直接发 YouTube 链接:
/summarize https://www.youtube.com/watch?v=xxxxx
Skill 会自动提取视频字幕(支持中英文),生成结构化总结。
无字幕的视频怎么办?
如果视频没有字幕,Skill 会先用 Whisper 转录音频再总结(需要安装 Lesson 23 的 Whisper Skill)。
第六步:总结图片内容
发送图片路径或 URL:
这张截图说的是什么?帮我总结:~/Desktop/会议截图.png
适合场景:
- 手机截图发到桌面后快速读取内容
- 扫描版 PDF 中的表格或图表解读
- 产品说明书的图片内容提取
第七步:总结音频文件
/summarize ~/Downloads/会议录音.mp3
Skill 会先转录再总结,输出:
- 会议主要议题
- 关键决策和结论
- 待办事项列表
自定义总结风格
你可以在指令中加入具体要求:
用中文总结这篇英文文章,只要 3 条核心观点,每条不超过 20 字:
https://example.com/english-article
总结这份 PDF,重点提取数字和数据:~/report.pdf
把这个 YouTube 视频总结成一篇微博风格的短文:
https://www.youtube.com/watch?v=xxxxx
常见问题
OpenClaw 能总结 PDF 吗?怎么操作?
可以。安装 Summarize Skill 后,直接发送 PDF 的本地路径(如 ~/Downloads/文件.pdf)或在线 PDF 的 URL 给 AI,说"帮我总结这份 PDF"即可。不需要额外的 API Key,使用你已配置的模型运行。
Summarize Skill 支持哪些格式?
支持网页(任意 URL)、PDF(本地和在线)、YouTube 视频(自动提取字幕)、图片(PNG/JPG/GIF)、音频(mp3/wav/m4a)。如果遇到无字幕视频,需要配合 Whisper Skill 先转录。
总结的长度能控制吗?
可以在指令中直接说明,比如"用 3 条要点总结"、"不超过 200 字"、"输出 5 分钟能读完的版本"。Skill 会遵循你的要求调整输出长度。
总结有没有字数或页数限制?
限制来自你配置的模型的上下文窗口。MiniMax M2.1 支持 200K token 上下文,一般的网页文章、PDF 报告都在范围内。超长内容(如整本书)建议分章节总结。
总结非中文内容时会自动翻译吗?
不会自动翻译,但你可以在指令中要求:用中文总结这篇英文文章。AI 会在总结的同时完成翻译。
没有网络的 PDF 能总结吗?
可以,发送本地文件路径即可,如 ~/Desktop/文件.pdf,不需要上传到任何云服务,所有处理都在本地完成。
实际工作流示例
每日信息摘要(配合 Lesson 06 的定时任务):
# 每天早 8 点自动总结订阅的 3 篇文章,推送到 Telegram
/summarize https://news.ycombinator.com
/summarize https://github.com/trending会议纪要自动生成:
把这个会议录音转成会议纪要,格式包含:决策事项、待办清单、负责人:
~/Recordings/weekly-sync.mp3
论文快速筛选:
帮我判断这篇论文值不值得精读,重点看方法论和实验结论:
https://arxiv.org/pdf/2501.12345