更新日志
本文档记录 PageEyes Agent 项目的所有重要变更。格式基于 Keep a Changelog,并且本项目遵循 语义化版本。
2025-09-03
新增
- 支持等待、停留等自然语言操作
- 断言支持判断页面/屏幕中是否存在某个关键字
变更
- 支持传递 OmniParser Key 鉴权
2025-08-01
优化
- 精简了系统提示词,每次调用使用更少的 token
- 优化报告的记录和生成逻辑,解决步骤偶然错乱的问题
- 优化工具的参数,实现最小化参数,减少 token
- 优化了等待逻辑,实现更精准的等待,不需要统一等待 1s
- 截图、解析改成异步,并发不阻塞
新增
- 浏览器配置支持使用持久化缓存,二次启动页面速度更快
2025-07-28
新增
- 增加滚动和滑动操作
- 支持 H5 swiper 组件滑动
2025-06-25
优化
- 优化 LLM Graph 控制
- 更新配置模式
2025-06-09
新增
- 支持 Web Agent 模式
- 增加执行报告和过程实时渲染
变更
- 重构同步方法为异步
2025-06-04
新增
- 支持移动端 Agent 模式
- 增加 click、input、open_url 工具
- 支持接入 OmniParser 进行元素解析
版本说明
- 主版本号:当进行不兼容的 API 更改时递增
- 次版本号:当以向后兼容的方式添加功能时递增
- 修订号:当进行向后兼容的缺陷修复时递增
有关详细的代码变更,请参阅 GitHub 提交历史。