第二章:Hermes的使用方式:CLI/TUI、Hermes WebUI、Gateway多平台使用

Hermes 知识库17小时前更新 changgong
320 00
hermes智能体

Hermes Agent 提供了多样化的交互方式,旨在满足不同用户场景和偏好,无论是命令行爱好者、图形界面用户还是多平台消息应用使用者,都能找到适合自己的操作模式。

本章将详细介绍 Hermes Agent 的三种主要交互方式:CLI 和 TUI、Hermes WebUI 以及 Gateway 与多平台使用。

一、CLI 和 TUI

Hermes Agent 的命令行界面 (CLI) 是其最核心且功能强大的交互入口之一。它提供了一个全功能的终端用户界面 (TUI),允许用户通过文本命令与 Agent 进行深度互动。

CLI 的主要特点包括:

  • 多行编辑:支持用户输入复杂的指令或多行文本,提升了交互的灵活性。
  • 斜杠命令自动补全:通过 / 引导的命令(如 /model/skills 等)支持自动补全功能,极大地提高了命令输入的效率和准确性。
  • 会话历史:Agent 会记住过去的对话内容,用户可以轻松回顾和引用历史信息,保持会话的连贯性。
  • 中断与重定向:用户可以在 Agent 执行任务时进行中断,并重新引导其行为。
  • 流式工具输出:Agent 执行工具时,其输出结果会实时流式显示在终端,让用户及时了解任务进展。

通过 hermes 命令即可启动交互式 CLI 会话,用户可以在此直接与 Agent 对话、下达指令、配置模型和工具等。这种方式对于开发者和高级用户而言,提供了最高效和最直接的控制能力。

二、Hermes WebUI

除了强大的命令行界面,Hermes Agent 还提供了一个直观的 Web 用户界面 (WebUI),通常被称为仪表盘 (Dashboard)。WebUI 为用户提供了一个图形化的操作环境,使得 Agent 的管理和监控更为便捷。

mac端一键部署命令:

git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
python3 bootstrap.py

启动后,一般访问:http://127.0.0.1:8787

WebUI 的主要功能包括:

  • 看板 (Kanban):Hermes Agent 内置了 Kanban 功能,允许用户以可视化的方式管理任务。用户可以在仪表盘上查看任务板,跟踪任务状态,甚至进行任务的创建、分配和协作。这对于多智能体协作和项目管理尤为重要。
  • 配置管理:WebUI 提供了图形化的界面来查看和修改 Agent 的各种配置,例如 LLM 模型、工具集、消息网关设置等,降低了配置的门槛。
  • 日志查看:用户可以通过 WebUI 方便地查看 Agent 的运行日志和历史记录,有助于问题诊断和行为分析。
  • 实时监控:仪表盘可以实时显示 Agent 的运行状态、任务进度和资源使用情况,让用户对 Agent 的工作一目了然。

三、Gateway 与多平台使用

Hermes Agent 的 Messaging Gateway 是其实现多平台无缝交互的关键组件。它允许 Agent 接入到各种主流的消息平台,从而实现“智能体随你而动”的愿景,无论用户身处何种应用环境,都能与 Hermes Agent 进行互动。

Gateway 的核心作用在于:

  • 统一接入:Gateway 作为一个中央枢纽,将来自不同消息平台的请求统一转发给 Hermes Agent 处理,并将 Agent 的响应返回给相应的平台。这意味着用户只需配置一次 Agent,即可在多个平台上使用。
  • 广泛的平台支持:Hermes Agent 的 Gateway 支持多达 20 多个平台,包括但不限于:
    • 社交与协作平台:Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Microsoft Teams, Google Chat。
    • 企业通讯平台:DingTalk (钉钉), Feishu (飞书), WeCom (企业微信), Weixin (微信), QQ Bot (QQ 机器人)。
    • 智能家居:Home Assistant。
    • 其他:Email, SMS, Yuanbao, BlueBubbles。
  • 跨平台会话连续性:用户在不同平台之间切换时,Agent 能够保持会话的连续性,记住上下文和历史记录。
  • 语音模式集成:Gateway 还支持语音备忘录转录和实时语音交互,例如在 Telegram、Discord 和 Discord VC 中实现语音模式。

配置示例:以飞书为例

以飞书为例,配置 Hermes Agent 接入飞书平台通常涉及以下步骤:

  1. 在飞书开放平台创建应用:获取 App ID 和 App Secret,并开启 Bot 能力。
  2. 准备 Hermes 最小配置:在 ~/.hermes/.env 文件中配置飞书相关的环境变量,如 FEISHU_APP_IDFEISHU_APP_SECRETFEISHU_DOMAIN 等。
  3. 推荐保留的 config.yaml 配置:在 ~/.hermes/config.yaml 中配置 group_sessions_per_user: true 以确保群聊中不同用户上下文独立,并设置 platforms.feishu.extra 中的重连和心跳间隔。
  4. 启动 Hermes 网关:运行 hermes gateway 或 hermes gateway setup 命令,启动网关服务。
  5. 验证成功:通过私聊或群聊机器人发送消息,并检查 ~/.hermes/gateway_state.json 文件确认连接状态。

Gateway 的设计使得 Hermes Agent 能够深度融入用户日常的工作和生活场景,提供无处不在的智能助理服务。

© 版权声明

相关文章

暂无笔记

您必须登录才能记录笔记!
立即登录
none
暂无笔记...