AI in ALL    AI in ALL
AI in ALL
知识图谱中枢:让智能体从交互辅助走向执行链路
文 | 新华三集团云与计算存储产品线 张龙兴

摘要

随着“Al in ALL”战略推动智能体(Agent)从交互辅助走向执行链路,企业级系统面临结构性风险:系统缺乏对智能体生成行为的系统级承认能力。

当前,主流的“智能体一工具一流程”架构,只能验证指令是否可生成、可调用、可编排,却无法判断一个动作在当前系统状态下是否成立。当智能体进入自动化运维、资源调度等执行场景时,这一缺失将直接转化为生产风险。

本文提出一种以知识图谱为核心的系统态语义基座架构,通过引入预执行语义约束(PESC)与执行期一致性校验,在决策生成与执行之间建立系统级准入机制。

在该架构下,知识图谱不再作为静态知识库存在,而是演进为系统状态的动态语义映射,成为执行型智能架构中的唯一可信语义参照面。

关键词

AI in ALL;知识图谱;语义网络;AI 智能体;图数据库;语义一致性

1 引言:当智能体进入执行层,系统缺失了什么

当前,智能体系统普遍存在一个隐形前提:只要计划逻辑合理、接口可调用,这个动作就是有效的。在辅助决策场景中,这一假设问题并不突出,因为是否执行仍由人工判断。但当智能体开始进入自动化运维、资源治理等执行型场景时,系统真正需要回答的,已经不再是“方案是否合理”,而是这个动作在当前系统状态下是否允许发生。

遗憾的是,现有架构并不能给出这一判断。智能体关注的是概率意义上的最优解,而系统需要的是确定性的状态判断。这种差异并非模型能力问题,而是系统层缺失了一种对行为进行承认或否决的机制,构成了执行型智能落地过程中的首个结构断点。

从架构上看,主流的“智能体—工具—流程”体系在职责划分上是清晰的:智能体负责意图理解与决策生成,工具负责具体操作执行,流程负责步骤与规则编排。但这套体系缺少一个关键能力——判断一组跨系统操作在整体上是否构成一个语义上成立的行为。系统可以校验“每一步能不能做”,却无法判断“这一整组动作现在是不是该做”,行动从生成到执行之间,由此形成了不可感知的系统态空洞。

这一问题无法通过优化模型或提示词解决,本质上是系统结构的缺失。因此,在决策层与执行层之间,必须引入一种系统承认机制:在执行发生之前,系统基于自身的实时状态,对智能体生成的决策进行统一的语义校验,只有通过校验的决策,才能进入执行链路。

这一机制应由以知识图谱为核心的系统态语义基座来承载。其并非对现有规则或流程的简单补充,而是作为系统状态的语义映射,负责判断“该动作在当前系统中是否成立”,从而补齐执行型智能架构中最关键的一环。

图 1 传统 Agent-Tool-Workflow 架构中的系统态盲区

2 系统态语义基座:系统如何判断一个行为是否成立

为了补齐上述盲区,就需要在决策层与执行层之间,嵌入独立的系统态语义基座。

图 2 知识图谱驱动智能体逻辑架构图

2.1 知识图谱的系统角色转变

在传统认知中,知识图谱通常被用作检索增强或知识问答的底层组件,其主要职责是提供文档或事实信息支持。但在执行型智能架构中,这一定位并不足以支撑系统级决策。

系统态语义基座关注的并不是“知识是否正确”,而是“系统中有哪些对象”“当前处于什么状态”,以及“这些状态之间是否相互约束”。

因此,其描述的不是静态知识,而是系统运行时的对象、状态与依赖关系。

在这一前提下,知识图谱的角色从“辅助理解”转变为系统级语义参照面,成为智能体与执行系统共同依赖的唯一状态来源。

2.2 系统态语义基座的核心交互

为了真正嵌入工程链路,系统态语义基座需要承担三类核心交互职责。

第一是,语义映射。

智能体生成的自然语言计划,不能直接进入执行层,而需要先被映射为图谱中的语义表达,明确操作对象、动作类型及约束条件。这一步的作用,是将模糊意图锚定为系统可识别的确定语义。

第二是,语义引用。

执行层不再直接操作自然语言描述的对象,而是基于图谱中的语义实体进行引用。工作流操作的是“图谱中状态满足条件的对象”,而不是“智能体描述的对象”,从而避免指代歧义。

第三是,状态回填。

执行结果需要被解析并回写至图谱中,更新对应实体的状态。只有形成这一闭环,图谱才能持续反映系统的真实运行状态,为后续决策提供可靠依据。

2.3 系统状态的实时可信问题

将知识图谱作为系统态基座,最大的工程挑战在于时效性。

传统图谱多依赖离线构建或周期性同步,而执行型智能要求系统能够基于接近实时的状态做出判断。一旦图谱状态滞后于实际系统,智能体的决策就可能基于过期信息,从而引发误操作。

因此,系统态语义基座必须采用事件驱动的构建方式,将监控、日志、配置、工单等异构数据源实时映射为统一的语义结构。同时,还需要具备基础的时序对齐能力,以避免因数据乱序造成的状态矛盾。

只有在满足实时性前提下,知识图谱才能从“查询用的知识集合”,演进为可参与系统决策的语义基础。

图3 图谱实时构建

2.4 基于流式计算的增量更新机制

针对知识图谱更新不及时的问题,本架构引入了基于流式处理的图计算机制,使图谱状态能够与实际系统状态保持亚秒级同步,从而避免传统图谱构建中常见的高延迟现象。该机制主要从数据采集、图更新方式以及存储组织三个方面进行优化。

首先,在数据采集阶段,系统不再采用周期性扫描的方式获取数据,而是通过变更捕获机制实时接入基础设施监控系统、配置中心和业务日志。当底层资源状态发生变化时,系统能够立即感知,并将这些变化转换为统一格式的图谱更新消息进行传递,从而避免出现以天或小时为单位的同步延迟。

其次,在图谱更新阶段,系统采用增量计算方式处理这些变更消息。与传统需要整体重建图谱的方式不同,计算过程只针对发生变化的节点及其关联关系进行局部更新。例如,当某一虚拟机出现故障时,系统仅重新计算该虚拟机及其相关业务链路的状态,而无需对整个网络拓扑重新建模,从而显著降低了计算开销并缩短了更新时间。

最后,在存储组织上,系统将变化频率不同的数据进行分离管理。部署关系等结构性信息以持久化方式存储在图数据库中,而 CPU 利用率等高频变化的运行状态数据则存放在内存缓存中,并通过统一的实体标识进行关联。这种设计在保证数据一致性的同时,使系统在高并发更新场景下仍能够保持毫秒级的查询响应能力。

2.5 知识图谱的结构必然性

系统态语义基座并非只能通过知识图谱实现,但在执行型智能场景下,知识图谱具备明显优势。

首先是关联表达能力。系统行为往往涉及跨资源、跨业务的级联影响,图谱天然适合描述这种多跳依赖关系。

其次是推理能力。状态冲突、互斥约束等判断,需要基于关系进行推演,这是传统关系模型难以高效支持的。

最后是结构灵活性。在持续演进的系统环境中,图谱的弱模式特性更利于快速引入新的对象类型与约束规则。

基于上述特性,知识图谱能够承担起系统态语义基座的职责,为后续的决策准入与一致性校验提供稳定支撑。

3 预执行语义约束:系统如何决定该不该执行

在系统态语义基座之上,系统需要具备一项明确能力——在执行发生之前,判断一个决策在当前系统状态下是否成立。

这一能力可定义为预执行语义约束(PESC, Pre-Execution Semantic Constraint)。

3.1 从权限控制到语义准入

传统系统的风险控制主要依赖权限模型(如 ACL),解决的是“谁可以操作”的问题。但在执行型智能场景中,核心风险已经发生转移。此时的问题不再是“有没有权限”,而是“这个操作现在是否合理”。

即便一个智能体具备合法身份、调用路径完全合规,其生成的行为在业务语义上仍可能是不成立的。

因此,系统需要在执行前引入一种新的准入判断方式,用于约束“行为本身是否被系统接受”。

PESC正是为此而设计的系统级语义准入机制。

3.2 决策进入执行前的语义校验

当智能体生成操作计划后,该计划不会直接进入执行层,而是首先进入语义约束节点。系统基于知识图谱,对决策进行统一判定。这其中,主要包括三类校验:

第一,对象存在性校验。

确认被操作的对象在系统中真实存在、语义唯一,且当前处于可操作状态。

第二,状态相容性校验。

判断操作前提是否与系统当前状态冲突,例如对象是否处于维护、锁定或业务封网阶段。

第三,演化边界校验。

评估该操作可能引发的状态变化,是否违反系统级约束,例如资源配额、隔离策略或高可用规则。

只有当上述校验全部通过,系统才认为该决策在语义上是闭合的,并允许其进入执行链路。

图 4 PESC 预执行语义约束判决逻辑

3.3 风险前移到执行之前

PESC的核心价值,在于将风险暴露的位置前移。

在缺乏语义约束的架构中,问题往往在执行失败甚至故障发生后才被发现。而通过预执行语义校验,系统可以在意图阶段直接阻断不合理行为。

这种阻断不是接口异常或流程错误,而是明确的业务语义否决,避免系统进入不可逆的错误状态。

3.4 从阻断到修正的闭环

PESC 并非只负责“拒绝执行”,还承担着语义反馈的职责。

当系统阻断某个决策时,会返回明确的冲突原因及约束条件,供智能体重新规划。

智能体不再简单报错退出,而是将这些反馈作为新的约束上下文,生成修正后的决策方案。

至此,系统形成了一个“生成—校验—修正—再生成”的决策闭环,为后续执行提供稳定前提。

4 执行期一致性:系统如何确认仍在正确路径上

即便决策在预执行阶段通过了语义校验,系统仍然面临另一个现实问题:执行过程本身可能偏离原始决策假设。

因此,系统需要在执行过程中持续验证行为是否保持语义一致。

4.1 执行的语义连续性

在执行型智能架构中,执行不应被视为一次原子的 API调用,而应被理解为一条随时间演进的语义轨迹。

每一个执行步骤,都会在系统状态中投射出新的变化点。这些变化需要被持续感知,并与原始决策中的语义预期进行对齐。

4.2 执行偏移的持续感知

执行期一致性机制并不干预具体的接口调用细节,而是关注执行结果在语义层面的投影。

系统会持续监听执行层的反馈,并将其映射回知识图谱。如果执行过程中出现明显偏移,例如:

◆执行耗时显著超出预期;

◆引发未在决策中预期的关联告警;

◆状态演化路径偏离原始假设;

系统将判定为语义一致性破坏,并触发相应的处理策略,如熔断、回滚或人工介入。

4.3 形成第二道系统防线

预执行语义约束解决的是“该不该开始”的问题,而执行期一致性解决的是“是否仍在正确路径上”的问题。

两者共同构成执行型智能架构中的双重防线,确保系统在引入智能体决策能力的同时,仍然保持对整体行为的可控性。

5 场景验证:系统态语义基座如何落到智能体中

三类典型场可验证该架构在实际工程环境中的落点方式,以及其对执行型智能风险的控制效果。

5.1 云运维智能体:资源调度的语义合规

场景特征:预测性维护场景。目标是在宿主机资源耗尽影响业务之前,识别异常虚拟机并做迁移/调度,保障集群稳定。

实战痛点:缺少系统态约束时,运维决策容易被“单一资源指标”牵引,触发合规风险。例如仅因Host-A CPU占用升高,就生成“将 VM-01 迁移至 Host-B”的指令;但 Host-B 可能属于核心数据库独占资源池,或与 VM-01 存在反亲和(Anti-Affinity)约束(主备不得同宿主)。

架构落点:引入系统态语义基座后,资源水位、业务标签、反亲和关系、资源池属性等被统一维护在图谱中。PESC 在执行前介入,完成三类关键校验:

第一类:基于图谱查询 VM-01的关联标签与 Host-B 的资源池属性;

第二类:基于图谱中的反亲和边进行规则推理,检测 Host-B 是否存在与 VM-01 互斥的实例;

第三类:若冲突成立,返回语义阻断并给出可行目标(例如建议迁移至符合规则的 Host-C)。

所以,结论是,本架构将资源调度的判定标准,从“物理可行”提升到“业务语义合规”,把风险阻断前移到执行前。

图 5 云运维场景 — 资源调度与部署互斥语义拦截

5.2 云业务导航智能体:基于图谱的解决方案语义寻路

场景特征:架构规划高频场景。输入是模糊业务意图(如“1000 卡规模 AI 训练集群”),输出是一套可部署架构,需要在大量云资源组合空间中完成一致性约束满足。

实战痛点:缺少“地图”(图谱)时,智能体容易陷入“参数拼装”:分别挑选最强计算、最低时延网络、最大容量存储,得到“离散最优但整体不可行”的组合(跨可用区、网络模型不兼容、协议互斥等),最终交付的是逻辑完美但物理无法落地的方案。

架构落点:引入系统态语义基座后,图谱承担“全链路语义导航地图”。PESC 不仅做拦截,更负责在搜索过程里剪枝与约束收敛,形成可行路径:

◆将“AI 训练集群”需求锚定到图谱中的解决方案模板子图;

◆沿 Depends_On / Located_In / Compatible_With 等语义边做广度搜索扩展;

◆一旦遇到互斥(Mutex)关系,立即剪枝;

◆从图谱中提取无冲突的可连通路径,并具象化为可部署架构输出。

结论是, 本架构把“随机搭积木”的方案生成,变为“受约束的语义寻路”,确保结果可落地。

图 6 云业务导航场景 — 解决方案语义寻路与架构生成

5.3 云运营智能体:私有云容量治理的语义校准

场景特征:私有云运营核心场景。在CapEx固定、资源有限的前提下,对全网资产做盘点与僵尸检测,目标是释放容量、提升资源池可用性。

实战痛点:缺少业务语义时,容易陷入“唯利用率论”。例如某VM-X长期占用高配额但 CPU/内存利用率接近0,就被判定为僵尸并建议回收;但其可能是核心交易系统异地容灾冷备节点,必须长期占位,即使不跑流量也不可回收。

架构落点:引入系统态语义基座后,资源利用率只是图谱上的一类属性;系统还显式维护资源角色、归属系统、SLA/RTO 等语义链路。PESC 在执行前完成语义穿透与结论校准:

◆将资源层数据挂载到图谱实体(VM-X)上;

◆沿语义边搜索其业务拓扑(角色→冷备→核心交易→SLA/RTO);

◆综合判断其“业务价值”高于“物理利用率”结论,推翻回收建议;

◆给出替代治理动作(例如仅允许降频/超卖,但保留占位)。

结论是,本架构在运营治理中实现“效率结论”到“业务语义结论”的校准,避免治理动作破坏业务连续性。

图7 运营场景 —— 私有云资产治理的语义校准

6 知识图谱为何成为执行型智能的系统中枢

当智能体开始从辅助分析走向执行链路,系统面临的核心问题已不再是“模型是否足够智能”,而是系统是否具备承认或否决智能体行为的能力。通过引入以知识图谱为核心的系统态语义基座,并在决策生成与执行之间构建预执行语义约束(PESC)与执行期一致性校验机制,补齐了执行型智能架构中长期缺失的系统态判断能力。

实践表明,在云运维、云业务导航与云运营等典型场景下,该架构能够在执行前阻断语义不成立的行为,并在执行过程中持续校验行为轨迹,从而将智能体决策纳入系统可控范围。因此,知识图谱在“AI in ALL”背景下不再只是能力外挂或知识增强组件,而是演进为支撑执行型智能落地的系统级中枢结构;这一结构并非可选优化,而是智能体进入生产核心系统所必需的工程前提。

关闭