Hermes是硅谷AI实验室Nous Research在今年2月开源的一款“自进化AI智能体框架”。Hermes这个名称并非是蹭奢侈品牌的热点,而是来自古希腊神话中身份多样化的众神使者Hermes。事实上,Nous的起名就来源于古希腊重要的哲学概念“努斯”(νους),即“直觉”的意思。

这家小型开源AI研究组织成立于2023年,所发布的Hermes系列开源大模型在HuggingFace上的下载量已超过5000万次。这一成果也使其在2024年初和2025年中分别完成2000万美元种子轮和5000万美元A轮融资,估值已达到10亿美元。

今年2月,Nous开源了Hermes Agent,迅速引爆了开发者社区,开源首月GitHub破2.2万星,截至4月23日GitHub总星标已突破11万,并在多日内持续霸榜全球开源榜单*。

尤其在4月以来,OpenClaw遭受到来自安全漏洞,及大模型企业Anthropic对OpenClaw用户更改大模型订阅政策的双重打击。Nous立刻推出了一键迁移工具,精准承接了大量“养虾人”。

快速走红的Hermes还引发了一些其他争议。4月中,我国AI团队EvoMap就控诉Hermes抄袭了其在2月开源的自进化引擎Evolver,各方众说纷纭。

当然,除了这些出圈话题,Hermes,或者说以Hermes为代表的一类AI智能体之所以能够火爆,更多是因为其特点精准击中了用户的痛点。

由于大模型的物理瓶颈和架构限制,传统AI智能体每次交互相对独立,无法保留历史信息。用户每次提问后,智能体完成回答便会“遗忘”之前的信息,一旦关闭窗口,下次交互需重新提供所有背景信息。这种“无状态”设计在简单问答场景中效率较高,但在需要长期跟踪的场景中存在明显不足。

根据官方说明,Hermes*的特色之一便是更强的记忆能力。其不仅能够在短期记忆中记住当前对话上下文,更可将关键信息持久化存储,形成长期记忆。经过多次交互后,Hermes有望逐渐掌握用户的偏好习惯及历史决策,并在后续交互中主动调用这些信息。

OpenClaw之所以能够火爆,便在于其强大的扩展能力,通过下载并安装技能文件(Skill)便可使得OpenClaw具备更多的能力。然而,网络下载的Skill良莠不齐,即便有一定经验的使用者也很难分辨。

绿盟科技天元实验室曾对OpenClaw官方Skills插件分发平台Claw Hub上的Skill样本进行分析,在采集的3000余个Skill样本中共识别出336个恶意投毒样本,占比超过10%,呈现出显著的规模化渗透特征与系统性风险水平。虽然随着后续官方的重视,这一安全风险有所改善,但对于没有丝毫鉴别能力的用户来说仍然是一个巨大的隐患。

Hermes则具有自我封装技能的能力。当完成一个复杂任务后,它会自动将执行流程打包为技能文件(Skill)。值得一提的是,该文件采用的文件格式内容完全透明可读可编辑,用户可审核每一步骤的逻辑与依据。一旦用户对生成的Skill审核通过后,该技能就将被固化存储,后续遇到类似任务可直接调用,无需从头推理。

一方面,由于自生成的技能完全透明可读,从而规避了来自外部的巨大风险;另一方面,生成的技能之后可直接调用,也将减小对算力资源的消耗。

更为重要的是,这将使得Hermes具有自我进化迭代的能力。随着使用时间的增加,它能够像一个真实的工作搭档一样,对于用户的使用习惯逐渐了解熟悉,“越用越懂你”。

Hermes的安全性也比OpenClaw更强,部署更为轻量,且默认在进行高危操作(如删除文件、群发消息等)时需要用户授权确认。当然,这也引发了部分用户对其需要频繁人工介入的吐槽。

此外,Hermes还具有低使用门槛(一条命令即可安装)、可兼容多种模型(内置ChatGPT、Claude、本地模型等超过80种后端)等优势。

不过,严格意义上而言,Hermes与OpenClaw实际上并非替代关系。Hermes的本质还是一个AI智能体,其设计是围绕如何让AI智能体功能更强大展开。相对而言,OpenClaw更像是一个AI智能体调度系统,通过调用不同的AI智能体来完成特定的任务。

事实上,OpenClaw也可以调用Hermes能力,两者之间的关系更像是互补。随着Hermes的走红,一些国内的“龙虾”也都开始加入Hermes进化功能。

自进化智能体,医疗场景应用潜力广泛

一般而言,医疗领域具有三个显著需求,长期记忆需求、流程标准化需求和安全合规需求。理论上而言,Hermes的核心能力尤其可以满足前两个需求,在安全合规上也并非先天不足。这使其在医疗领域具有较大的潜力。

最能发挥Hermes优势的莫过于慢病管理。

以糖尿病、高血压、慢阻肺等需长期随访管理的慢病而言,当前的随访模式具有不少痛点。患者的信息碎片化且分散,在有限的复诊时间中,医生难以获取患者的完整病史,常需患者重复叙述病史,但患者记忆可能出现偏差,且极有可能遗漏关键信息。虽然也可以调取历史档案,但并不直观,且耗时费力。

Hermes则可以作为医生助手,不仅可以实现24*7不间断在线答复患者咨询,也能根据医生及患者习惯进行个性化调整,在复诊前还能自动将散乱的患者历史数据整理成包含指标趋势、用药变化在内的临床摘要,减少医患间的信息同步成本。

同时,在有限的复诊时间中,医生往往只能基于单次就诊信息做出判断,难以观察指标变化趋势,可能遗漏早期预警信号。Hermes理论上则能够整合患者数月甚至数年的数据,形成连续的患者画像。

比如,当患者尿微量白蛋白呈现持续缓慢上升趋势,即使单次检测仍处于临界范围,Hermes也可识别这一趋势,提示糖尿病肾病进展风险,为早期干预提供依据。

Hermes的自我进化能力也使其可以通过长期交互积累患者的个性化健康画像,比如哪些食物会导致血糖飙升、哪种运动方案患者真正能坚持、什么时间段提醒服药效果*等。并将这些经验沉淀为结构化记忆,不断校准自己的干预策略。从而使得真正“千人千面”的自动化、个性化干预成为可能。

不光是院内复诊,对于第三方的专业慢病管理模式来说,Hermes的这些特性同样有很大帮助。

在医生培训和科研辅助上,Hermes也有颇多用武之地。

医疗领域存在大量资深专家的诊疗经验、疑难病例处理思路及医患沟通技巧等“隐形知识”。这些知识很难通过教材或论文系统化传承,传统的培训模式效率有限,且受限于带教人数与地理范围。

Hermes则可自动记录资深专家的决策逻辑、用药选择、检查顺序、鉴别诊断思路等信息,在经过审核后固化为可复用的技能文件。年轻医生通过学习这些技能,相当于间接获得专家经验的传承。

这一模式对于基层医生培训、医疗资源下沉具有不小的潜在价值。

此外,在临床科研工作中,数据清洗、文献调研和格式调整等繁琐工作占据了大量时间,使得医生真正用于数据分析与论文写作的时间比例非常有限。Hermes若能记忆研究者的偏好设定(如数据清洗规则、排除标准及文献关注领域),可在后续研究中提供针对性建议,减少重复劳动,使研究者将更多时间投入核心工作。

在数据安全上,Hermes支持本地部署,可以保证患者数据留存本地,满足合规要求。同时,这种方式也无需持续支付API调用,降低了长期使用成本。其技能文件也完全透明可编辑,出现问题时方便追溯分析。

当然,必须要承认,虽然设计了多重安全机制,但Hermes代表的AI智能体应用在医疗合规上也有挑战所在。最为明显的莫过于其自封装技能,若其基于有限样本归纳出错误规律,并将该规律固化为技能,可能导致系统性错误,且不易被发现。这是因为错误并非来源于AI幻觉,而是因为数据样本有限导致的局限性。

正因为此,Hermes的技能审核十分重要,自动生成的技能需经人工审核方可固化使用。审核界面完整展示技能的每一步骤,用户可逐条确认或修改,并对重要技能采用多人审核或同行评议机制,以降低个体疏漏风险。

然而,恰恰是这种自我进化的特性,使其几乎不可能通过现行医疗器械监管。正因为此,Hermes的定位显然更适合分诊断的辅助工具,主要功能应是帮助记忆、沉淀经验,但最终决策权始终在医生手中。由于Hermes的所有记忆内容与技能文件均透明可见、可修改、可删除,且风险操作需用户介入授权。因此,用户拥有完全掌控权。

写在最后

从OpenClaw到Hermes,这些AI概念的走红不过是当前AI迅猛发展的一个缩影。Hermes,或者说以Hermes为代表的一类AI技术则代表了AI技术的发展趋势,标志着AI智能体从“无状态工具”向“有记忆伙伴”的演进。在医疗这一需要长期跟踪、经验沉淀的领域,这一转变具有实质性的落地价值。要不了多久,我们或许就可以看到实际落地的产品问世。

当然,对于医疗行业来说,任何时候,安全都应放在*位。无论是3月底工业和信息化部等十部门发布的《人工智能科技伦理审查与服务办法(试行)》,还是4月初国内40余家医疗卫生与科研机构共同制定的《医疗机构人工智能应用与治理专家共识(2026 版)》,都明确了医院是AI应用安全的*责任人,医生则是最后一道防线。一旦AI出现问题,医院需承担法律责任。

正因为此,在引入AI的过程中必须明确AI仅是辅助作用,时刻谨记,审核机制必须严格执行,安全底线不可逾越。