OWL AI

2个月前发布 1.9K 00

OWL是基于CAMEL-AI框架构建的、在GAIA基准测试中以69.09%平均分排名开源框架第一的多智能体协作与真实世界任务自动化平台。

收录时间：

2026-05-17

打开网站

AI聊天 # AI聊天 # OWL AI

OWL AI

打开网站

文章目录

一、项目概述
二、核心亮点与基准表现
三、核心功能特性
四、架构与工作流
五、安装与环境配置
六、模型支持与选择
七、快速开始与使用示例
八、Web用户界面
九、社区与贡献
十、引用与许可

OWL：优化工作力学习框架——通用多智能体协作与真实世界任务自动化

一、项目概述

OWL（Optimized Workforce Learning）是由CAMEL-AI社区开发的一款前沿的多智能体协作框架，旨在突破任务自动化的边界。该框架基于CAMEL-AI Framework构建，核心理念是通过动态的智能体交互，实现更自然、高效且鲁棒的真实世界任务自动化。

二、核心亮点与基准表现

OWL在业界公认的GAIA基准测试中取得了69.09的平均分，在所有开源框架中排名第一。这一成绩充分验证了其在实际任务自动化领域的领先水平。该技术成果已被NeurIPS 2025接收，技术报告可在arXiv上查阅。

三、核心功能特性

1. 在线搜索能力：支持多种搜索引擎，包括Wikipedia、Google、DuckDuckGo、百度、Bocha等，实现实时信息检索与知识获取。

2. 多模态处理：能够处理来自互联网或本地的视频、图像和音频数据，具备全面的多模态理解能力。

3. 浏览器自动化：基于Playwright框架，支持模拟浏览器交互操作，包括滚动、点击、输入、文件下载、页面导航等。

4. 文档解析：支持从Word、Excel、PDF和PowerPoint文件中提取内容，并将其转换为文本或Markdown格式。

5. 代码执行：能够使用解释器编写和执行Python代码，实现动态计算与自动化脚本运行。

6. 内置工具包生态：提供丰富的内置工具包，包括但不限于：

模型上下文协议（MCP）：标准化AI模型与各类工具及数据源的交互协议层。
核心工具包：ArxivToolkit、音频分析、代码执行、Dalle、Excel、GitHub、Google Maps、Google Scholar、图像分析、数学工具、NetworkX、Notion、OpenAPI、Reddit、搜索、语义学者、SymPy、视频分析、天气、浏览器等。

四、架构与工作流

OWL的架构设计围绕多智能体协作展开。系统能够根据任务需求，动态调用不同的智能体与工具包。例如，当任务涉及网页交互时，系统会自动启动浏览器工具；如果任务仅需搜索或代码执行，则不会启动浏览器，从而优化资源使用。这种灵活的工作流设计使得OWL能够高效应对复杂多变的真实世界任务。

五、安装与环境配置

支持的Python版本：3.10、3.11、3.12。

安装方式：

推荐方式：使用uv工具进行快速安装。
虚拟环境：支持venv、pip以及conda环境。
Docker支持：提供预构建镜像和本地构建脚本，方便容器化部署。

环境变量：用户需配置API密钥，可直接在终端设置或通过.env文件管理。对于最小化示例，仅需配置LLM的API密钥（如OpenAI API Key）。

六、模型支持与选择

OWL要求底层模型具备强大的工具调用能力，以便与各类工具包交互。对于涉及网页、图像或视频处理的任务，模型还需具备多模态理解能力。

支持的模型平台：

OpenAI（GPT-4及后续版本，推荐用于最佳性能）
Claude
Qwen
DeepSeek
Gemini
Azure OpenAI
Ollama
其他兼容OpenAI接口的模型

七、快速开始与使用示例

安装并配置好环境变量后，用户可以通过运行python examples/run.py快速启动。用户可以通过修改脚本中的任务描述来定义自己的任务，例如：

“查找苹果公司的最新股价。”
“分析最近关于气候变化的推文情绪。”
“帮我调试这段Python代码。”
“总结这篇研究论文的主要观点。”
“为这个数据集创建数据可视化。”

对于本地文件任务，只需在问题中提供文件路径，OWL会自动调用文档处理工具进行解析。

八、Web用户界面

OWL还提供了基于Gradio构建的Web用户界面，支持中文、英文和日文版本。用户可以通过Web UI轻松选择模型、管理环境变量、与智能体进行交互对话，并查看任务历史记录。所有数据均在本地运行，无需担心外部服务器泄露。

九、社区与贡献

OWL拥有活跃的社区，欢迎各类贡献，包括代码改进、文档更新和新功能提案。社区还发起了“智能体挑战赛”，鼓励用户设计独特的任务来测试AI智能体的能力。用户可以通过Discord或微信加入社区讨论。

十、引用与许可

OWL的源代码采用Apache 2.0许可证开源。如果该框架对您的研究或项目有帮助，请引用其技术报告：

@misc{hu2025owl, title={OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation}, author={Mengkang Hu and Yuhang Zhou and Wendong Fan and Yuzhou Nie and Bowei Xia and Tao Sun and Ziyu Ye and Zhaoxuan Jin and Yingru Li and Qiguang Chen and Zeyu Zhang and Yifeng Wang and Qianshuo Ye and Bernard Ghanem and Ping Luo and Guohao Li}, year={2025}, eprint={2505.23885}, archivePrefix={arXiv}, primaryClass={cs.AI} }

暂无笔记

您必须登录才能记录笔记！

立即登录

暂无笔记...

OWL AI

OWL：优化工作力学习框架——通用多智能体协作与真实世界任务自动化

一、项目概述

二、核心亮点与基准表现

三、核心功能特性

四、架构与工作流

五、安装与环境配置

六、模型支持与选择

七、快速开始与使用示例

八、Web用户界面

九、社区与贡献

十、引用与许可

相关导航

腾讯云大模型知识引擎

天工AI

chatbase

揽睿星舟

flowgpt

数以轻舟Agent

Fellou – Fellou AI 推出的首个Agentic浏览器

OpenAI Playground

暂无笔记

欢迎来到「PMKG AI知识库」

欢迎来到 PMKG AI知识库