介绍
整体架构
PageEyes Agent 是一个 Python UI 自动化 Agent 框架,帮助你用自然语言快速、稳定地完成跨平台 UI 自动化测试、巡检和业务验证。
PageEyes Agent 以自然语言指令颠覆传统UI自动化:无需编写脚本,也能实现复杂的跨平台测试与巡检。 基于 Pydantic AI 框架开发, 其中元素信息感知能力依靠 OmniParserV2 模型,不依赖视觉语言大模型, 即使小参数的 LLM 也能胜任路径规划能力,同时支持多平台(Web、Android)
整体框架
Agent 执行流程