跳转至

PageEyes Agent

规划

page-eyes-agent

路线图

PageEyes Agent 项目的发展路线图概述了当前短期和长期目标、计划中的功能以及技术改进。本文档将定期更新，以反映项目的最新发展方向。

当前阶段（2025 Q3）

核心功能增强

[x] 自然语言操作增强：支持等待、停留等更多自然语言操作（已完成于 2025-09-03）
[x] 断言能力增强：支持判断页面/屏幕中是否存在特定关键字（已完成于 2025-09-03）
[x] 视觉解析模型优化：使用针对特定业务领域优化的预训练模型（已完成于 2025-09-03）
[ ] 复杂交互支持：拖放操作、悬停菜单、多级导航等复杂交互模式

性能优化

[x] 系统提示词精简：减少每次调用的 token 消耗（已完成于 2025-08-01）
[x] 异步处理优化：截图和解析改为异步并发处理（已完成于 2025-08-01）
[ ] 缓存机制增强：智能缓存页面结构和元素位置信息
[x] 批量操作支持：优化连续相似操作的执行效率

平台支持

[x] Web 平台支持：完整支持桌面浏览器自动化（已完成于 2025-06-09）
[x] 移动端支持：Android 平台支持（已完成于 2025-06-04）
[x] iOS 平台支持：通过 XCUITest 实现 iOS 自动化
[x] 华为鸿蒙系统支持：华为鸿蒙系统自动化

近期规划（2025 Q4）

智能化增强

上下文感知：增强 Agent 对测试上下文的理解能力
自适应等待策略：基于页面加载状态和网络条件动态调整等待时间
智能重试机制：针对不同类型的失败实现差异化重试策略
异常场景处理：增强对弹窗、验证码、网络波动等异常场景的处理能力

开发者体验

交互式调试工具：提供可视化界面实时查看和调试 Agent 执行过程
本地化部署方案：简化企业内部部署流程，支持离线运行

集成与扩展

多 Agent 协作：支持多个 Agent 协同完成复杂测试场景

长期愿景（2026+）

技术前瞻

多模态理解：结合视觉和文本理解能力，提升复杂界面的交互能力
自我修复测试：Agent 能够自动适应 UI 变化，减少维护成本
测试策略优化：基于历史执行数据，自动优化测试策略和覆盖范围
低资源模式：优化资源消耗，支持在资源受限环境中高效运行

生态系统

开发者社区：建立活跃的开发者社区，促进知识共享和最佳实践

应用场景拓展

性能监控：集成前端性能监控能力

参与贡献

我们欢迎社区参与 PageEyes Agent 的开发。如果您有兴趣贡献代码、提出功能建议或报告问题，请参阅我们的贡献指南。

优先级调整

路线图中的项目优先级可能会根据用户反馈和项目需求进行调整。我们鼓励用户通过 GitHub Issues 提交功能请求和反馈，帮助我们确定开发优先级。

注：本路线图仅代表当前的开发计划，实际发布时间和功能可能会有所变动。

最后更新：2025-09-19