概述
# 新更新:Anthropic Claude 计算机使用/LLM 集成
Ui.Vision RPA Software. 开源的 Selenium IDE, 现代的网页自动化工具 (支持行为录制和回放)。适用于网页自动化测试,表单填写以及网页内容抓取。
开源 Ui.Vision 一直处于可视化网络自动化的前沿。通过 Claude 的集成,我们正在迈出下一步。aiComputerUse 命令允许您用单行代码自动化复杂任务,这些任务传统上需要数百行经典 Ui.Vision 命令(如 XClick、OCRExtractScreenshot、If/then 语句等)。例如,您只需一个简短的"玩这个游戏..."提示,就可以教 Ui.Vision 玩井字游戏。
---
Ui.Vision 是一款开源自动化 RPA 软件,结合了经典浏览器自动化与现代计算机视觉和 OCR:
(1) **可视化浏览器自动化**
Ui.Vision 的可视化 UI 测试命令帮助网页设计师和开发者检查并确保网站布局和画布元素的准确性。它可以识别并读取画布元素、图像和视频中的图像和文本。
(2) **适用于 Windows、Mac 和 Linux 的可视化桌面自动化**
除了网页浏览器自动化外,Ui.Vision 还使用图像和文本识别(OCR)来自动化浏览器扩展和桌面环境。它可以解释桌面上的图像和文本,执行点击、移动、拖放鼠标以及模拟键盘输入等操作。
这种桌面自动化需要安装免费的 Ui.Vision XModules,适用于 Windows、Mac 和 Linux。这些模块为 Ui.Vision 提供了桌面交互所需的功能。
(3) **兼容 Selenium IDE 的命令**
Ui.Vision 包含用于网络自动化、测试、表单填写和网络抓取的 Selenium 风格命令。学习 Ui.Vision 也意味着学习 Selenium IDE,反之亦然。
然而,Ui.Vision 的理念与经典的 Selenium IDE 不同。Ui.Vision 提供了经典 Selenium IDE 中没有的功能,包括用于 UI 测试的计算机视觉、图像比较、文件下载自动化、OCR 屏幕抓取、PDF 测试以及捕获完整网页和桌面截图。
**命令行 API**
Ui.Vision 提供了详细的命令行 API,用于与其他应用程序集成,通常与 Jenkins、CI/CD 工具或 Windows 任务计划程序一起使用。它可以使用任何编程或脚本语言(如 Python 或 PowerShell)进行自动化和控制。
**开源(AGPL 许可)**
Ui.Vision 扩展源代码在 Github 上可用。这使 Ui.Vision 成为一个很好的开源 Selenium IDE 替代品和 iMacros 替代品。
**100% 本地软件**
免费且开源。无云端服务,无订阅。无重复付款。该软件不会将任何数据发送回我们或任何其他地方。所有操作,包括图像识别和 OCR 处理,都在您的机器上本地完成。
"所有数据都在本地处理"规则的唯一例外是,如果您选择可选的在线 OCR 引擎或 AI Computer Use 命令。所有云功能默认都是禁用的。只有当您在设置中明确启用它们时,Ui.Vision 才会将截图发送到云服务。默认的 OCR 选项是 Javascript OCR 或 XModule OCR,它们都在机器上 100% 本地运行。
**祝您自动化愉快!**
如有问题和建议,请访问 Ui.Vision 社区论坛:https://forum.ui.vision
留言
来自商店的评价 (0)