跳转至

更新日志

本文档记录 PageEyes Agent 项目的所有重要变更。格式基于 Keep a Changelog,并且本项目遵循 语义化版本

2025-09-03

新增

  • 支持等待、停留等自然语言操作
  • 断言支持判断页面/屏幕中是否存在某个关键字

变更

  • 支持传递 OmniParser Key 鉴权

2025-08-01

优化

  • 精简了系统提示词,每次调用使用更少的 token
  • 优化报告的记录和生成逻辑,解决步骤偶然错乱的问题
  • 优化工具的参数,实现最小化参数,减少 token
  • 优化了等待逻辑,实现更精准的等待,不需要统一等待 1s
  • 截图、解析改成异步,并发不阻塞

新增

  • 浏览器配置支持使用持久化缓存,二次启动页面速度更快

2025-07-28

新增

  • 增加滚动和滑动操作
  • 支持 H5 swiper 组件滑动

2025-06-25

优化

  • 优化 LLM Graph 控制
  • 更新配置模式

2025-06-09

新增

  • 支持 Web Agent 模式
  • 增加执行报告和过程实时渲染

变更

  • 重构同步方法为异步

2025-06-04

新增

  • 支持移动端 Agent 模式
  • 增加 click、input、open_url 工具
  • 支持接入 OmniParser 进行元素解析

版本说明

  • 主版本号:当进行不兼容的 API 更改时递增
  • 次版本号:当以向后兼容的方式添加功能时递增
  • 修订号:当进行向后兼容的缺陷修复时递增

有关详细的代码变更,请参阅 GitHub 提交历史