Hermes Agent:来自 Nous Research,一个开源自主 Agent、服务器驻留、定时任务、可接入多个 IM 平台,而且能持续学习你的项目、习惯和需求。

六个核心能力解析

1. 多平台消息网关
并非简单的 webhook 推送,是双向对话同步:
· 在 Telegram 发起任务,可以在 CLI 继续跟进
· 支持语音消息转录
· 所有平台共享同一个上下文状态
对需要移动办公的开发者很有价值——你可以在通勤时语音交代任务,回到电脑前查看完整结果。

2. Skills 系统
它会自动把解决过的问题写成"技能文档":
解决了一个复杂的 Docker 部署问题
→ 自动生成 SKILL.md
→ 下次遇到类似问题时直接调用
技能文件遵循 agentskills. io 开放标准,可以:
· 搜索已有技能
· 从社区 hub 安装(ClawHub、LobeHub、Claude Code Marketplace)
· 分享给其他用户
这比传统的 prompt 模板或 function calling 更有弹性——它是程序性记忆,会随着使用自动积累。

3. 定时任务(Cron)
内置调度器支持自然语言设定:
"每天早上 8 点给我发昨日代码提交摘要"
"每周五晚上备份数据库"
任务可以输出到任意已连接的消息平台。

4. Subagents 并行
可以派生隔离的 Subagents 处理并行工作流:
· 每个 Subagent 有独立的会话和终端
· 支持 Python RPC 调用工具
· 多步骤 pipeline 可以压缩成单次交互
你可以同时让多个"数字员工"处理不同任务,而主 Agent 只接收最终结果。

5. 沙箱执行环境
提供五种终端后端,安全级别递进:
· Local - 本地执行
· Docker - 容器隔离(只读 root、降权、PID 限制)
· SSH - 远程机器
· Singularity - HPC 场景
· Modal - 云函数执行
这种设计考虑到了不同场景的安全需求——日常任务用 Docker,敏感操作用更严格的隔离。

6. 完整浏览器控制
· 导航、点击、输入、截图
· 结合视觉模型分析页面
· 图像生成、TTS 集成
这让 Agent 可以处理需要人机交互的 Web 任务,比如填写表单、操作后台系统。

技术栈与部署

安装
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

支持的 LLM 提供商
· Nous Portal(OAuth 认证)
· OpenRouter(API Key)
· 自定义端点
Nous Research 本身是模型研发机构,他们主推的 Nous Portal 应该会有优化。

40+ 内置工具
覆盖开发工作的各个维度:
· 文件系统、终端、浏览器
· 网络搜索、视觉分析、图像生成
· 内存管理、任务规划、定时任务
· 代码执行、Subagents、Skills 管理

面向研究者的功能
作为研究机构的产品,Hermes 内置了批量处理与 RL 训练能力:
· Batch Processing - 并行生成数千条 tool-calling 轨迹,自动 checkpoint
· RL Training - 通过 Atropos 集成,支持对 Agent 行为进行强化学习训练
· Trajectory Export - 导出 ShareGPT 格式数据用于微调,支持轨迹压缩控制 token 消耗
 
 
Back to Top