维护咨询 大模型部署 问题解决 技能定制 大模型训练
很多网站数据不能直接API访问,需要模拟人操作浏览器。Hermes Agent内置浏览器自动化能力,让AI直接操控Chrome/Firefox浏览器。
本文讲清楚怎么用,从基础操作到抓取动态网页再到填表提交。
## 浏览器工具能做什么
navigate # 打开网页
snapshot # 获取页面内容
click # 点击按钮/链接
type # 输入文字
scroll # 滚动页面
screenshot # 截图
console # 获取JS错误日志
back/forward # 前进/后退
这些能力组合起来,AI就能模拟人的操作访问任何网页。
—
## 基础用法:让AI自动搜索
帮我用浏览器打开Google,搜索"2024年AI发展趋势",然后把前10条搜索结果的标题和链接整理给我
AI会自动:
1. 打开Chrome
2. 导航到google.com
3. 输入搜索词
4. 点击搜索
5. 读取结果页面
6. 整理输出
—
## 抓取动态渲染页面
很多现代网页用JavaScript动态加载内容,直接请求HTML拿不到数据。
问题网页:
帮我抓取这个页面所有产品列表:https://example.com/products
如果页面是JS渲染的,直接请求HTML只有空壳,需要浏览器执行JS才能拿到数据。
AI会怎么处理:
AI发现是动态页面,会启动无头浏览器(headless Chrome),执行JavaScript,等待内容加载完成,再抓取数据。
—
## 自动填表和提交
场景:需要批量注册账号、提交表单、登录网站。
帮我完成这个网站的注册:
1. 打开 https://example.com/register
2. 填写信息:用户名test001、邮箱test@test.com、密码Test1234
3. 点击同意条款
4. 点击注册按钮
5. 告诉我注册结果
注意事项:
– 如果网站有防爬虫机制,AI会检测到并提示你
– 需要验证码的网站无法自动化处理
– 提交前AI会显示要提交的内容让你确认
—
## 自动处理多页数据
场景:抓取需要翻页的列表数据。
帮我抓取这个论坛的所有帖子标题,共100页:
1. 第一页获取所有标题
2. 点击下一页
3. 重复直到第100页
4. 整理成CSV格式
AI会自动翻页、提取、汇总。你设置页数上限,防止失控。
—
## 截图和视觉检查
页面截图:
帮我截取这个页面的截图:https://example.com/dashboard
AI会截图并保存,方便你人工检查。
检查页面渲染是否正确:
帮我打开这个页面,截图确认页面渲染是否正常,
特别检查:导航栏是否显示、轮播图是否加载、底部版权信息是否存在
—
## 反爬虫检测和应对
AI会自动检测常见反爬虫机制:
检测到的反爬虫措施:
- Cloudflare验证 → 需要手动过验证
- 验证码 → 无法自动处理
- IP限制 → 建议换IP或降低访问频率
- 请求频率限制 → AI会自动降低速度
如果遇到AI无法处理的反爬虫,它会停下来告诉你原因和解决方案。
—
## 实际案例:竞品价格监控
帮我监控竞品价格:
1. 打开京东,搜索"iPhone 15"
2. 获取前10个商品的价格
3. 记录在CSV里
4. 每天早上9点自动执行
5. 如果价格低于某个值,通知我
配合定时任务,实现全自动价格监控。
—
## 常见问题
Q:需要手动打开浏览器吗?
A:不需要。AI会自动启动无头浏览器(不显示窗口),执行完自动关闭。
Q:能处理需要登录的页面吗?
A:能。第一次手动登录后,AI会保存cookies,后续访问自动带上登录状态。
Q:能抓取需要滑块的验证吗?
A:不能。滑块验证码需要图形识别,AI目前无法自动处理。
Q:访问频率限制怎么办?
A:AI会自动降低访问速度。如果被封IP,需要换代理或等待解封。
—
## 相关文章








暂无评论内容