路线图
PageEyes Agent 项目的发展路线图概述了当前短期和长期目标、计划中的功能以及技术改进。本文档将定期更新,以反映项目的最新发展方向。
当前阶段(2025 Q3)
核心功能增强
- [x] 自然语言操作增强:支持等待、停留等更多自然语言操作(已完成于 2025-09-03)
- [x] 断言能力增强:支持判断页面/屏幕中是否存在特定关键字(已完成于 2025-09-03)
- [x] 视觉解析模型优化:使用针对特定业务领域优化的预训练模型(已完成于 2025-09-03)
- [ ] 复杂交互支持:拖放操作、悬停菜单、多级导航等复杂交互模式
性能优化
- [x] 系统提示词精简:减少每次调用的 token 消耗(已完成于 2025-08-01)
- [x] 异步处理优化:截图和解析改为异步并发处理(已完成于 2025-08-01)
- [ ] 缓存机制增强:智能缓存页面结构和元素位置信息
- [ ] 批量操作支持:优化连续相似操作的执行效率
平台支持
- [x] Web 平台支持:完整支持桌面浏览器自动化(已完成于 2025-06-09)
- [x] 移动端支持:Android 平台支持(已完成于 2025-06-04)
- [ ] iOS 平台支持:通过 XCUITest 实现 iOS 自动化
- [ ] 华为鸿蒙 系统支持:华为鸿蒙系统自动化
近期规划(2025 Q4)
智能化增强
- 上下文感知:增强 Agent 对测试上下文的理解能力
- 自适应等待策略:基于页面加载状态和网络条件动态调整等待时间
- 智能重试机制:针对不同类型的失败实现差异化重试策略
- 异常场景处理:增强对弹窗、验证码、网络波动等异常场景的处理能力
开发者体验
- 交互式调试工具:提供可视化界面实时查看和调试 Agent 执行过程
- 本地化部署方案:简化企业内部部署流程,支持离线运行
集成与扩展
- 多 Agent 协作:支持多个 Agent 协同完成复杂测试场景
长期愿景(2026+)
技术前瞻
- 多模态理解:结合视觉和文本理解能力,提升复杂界面的交互能力
- 自我修复测试:Agent 能够自动适应 UI 变化,减少维护成本
- 测试策略优化:基于历史执行数据,自动优化测试策略和覆盖范围
- 低资源模式:优化资源消耗,支持在资源受限环境中高效运行
生态系统
- 开发者社区:建立活跃的开发者社区,促进知识共享和最佳实践
应用场景拓展
- 性能监控:集成前端性能监控能力
参与贡献
我们欢迎社区参与 PageEyes Agent 的开发。如果您有兴趣贡献代码、提出功能建议或报告问题,请参阅我们的贡献指南。
优先级调整
路线图中的项目优先级可能会根据用户反馈和项目需求进行调整。我们鼓励用户通过 GitHub Issues 提交功能请求和反馈,帮助我们确定开发优先级。
注:本路线图仅代表当前的开发计划,实际发布时间和功能可能会有所变动。
最后更新:2025-09-19