《数字化领航》AI技术专刊

AI in ALL

知识图谱中枢：让智能体从交互辅助走向执行链路

文 | 新华三集团云与计算存储产品线张龙兴

摘要

随着“Al in ALL”战略推动智能体（Agent）从交互辅助走向执行链路，企业级系统面临结构性风险：系统缺乏对智能体生成行为的系统级承认能力。

当前，主流的“智能体一工具一流程”架构，只能验证指令是否可生成、可调用、可编排，却无法判断一个动作在当前系统状态下是否成立。当智能体进入自动化运维、资源调度等执行场景时，这一缺失将直接转化为生产风险。

本文提出一种以知识图谱为核心的系统态语义基座架构，通过引入预执行语义约束（PESC）与执行期一致性校验，在决策生成与执行之间建立系统级准入机制。

在该架构下，知识图谱不再作为静态知识库存在，而是演进为系统状态的动态语义映射，成为执行型智能架构中的唯一可信语义参照面。

关键词

AI in ALL；知识图谱；语义网络；AI 智能体；图数据库；语义一致性

1 引言：当智能体进入执行层，系统缺失了什么

当前，智能体系统普遍存在一个隐形前提：只要计划逻辑合理、接口可调用，这个动作就是有效的。在辅助决策场景中，这一假设问题并不突出，因为是否执行仍由人工判断。但当智能体开始进入自动化运维、资源治理等执行型场景时，系统真正需要回答的，已经不再是“方案是否合理”，而是这个动作在当前系统状态下是否允许发生。

遗憾的是，现有架构并不能给出这一判断。智能体关注的是概率意义上的最优解，而系统需要的是确定性的状态判断。这种差异并非模型能力问题，而是系统层缺失了一种对行为进行承认或否决的机制，构成了执行型智能落地过程中的首个结构断点。

从架构上看，主流的“智能体—工具—流程”体系在职责划分上是清晰的：智能体负责意图理解与决策生成，工具负责具体操作执行，流程负责步骤与规则编排。但这套体系缺少一个关键能力——判断一组跨系统操作在整体上是否构成一个语义上成立的行为。系统可以校验“每一步能不能做”，却无法判断“这一整组动作现在是不是该做”，行动从生成到执行之间，由此形成了不可感知的系统态空洞。

这一问题无法通过优化模型或提示词解决，本质上是系统结构的缺失。因此，在决策层与执行层之间，必须引入一种系统承认机制：在执行发生之前，系统基于自身的实时状态，对智能体生成的决策进行统一的语义校验，只有通过校验的决策，才能进入执行链路。

这一机制应由以知识图谱为核心的系统态语义基座来承载。其并非对现有规则或流程的简单补充，而是作为系统状态的语义映射，负责判断“该动作在当前系统中是否成立”，从而补齐执行型智能架构中最关键的一环。

图 1 传统 Agent-Tool-Workflow 架构中的系统态盲区

2 系统态语义基座：系统如何判断一个行为是否成立

为了补齐上述盲区，就需要在决策层与执行层之间，嵌入独立的系统态语义基座。

图 2 知识图谱驱动智能体逻辑架构图

2.1 知识图谱的系统角色转变

在传统认知中，知识图谱通常被用作检索增强或知识问答的底层组件，其主要职责是提供文档或事实信息支持。但在执行型智能架构中，这一定位并不足以支撑系统级决策。

系统态语义基座关注的并不是“知识是否正确”，而是“系统中有哪些对象”“当前处于什么状态”，以及“这些状态之间是否相互约束”。

因此，其描述的不是静态知识，而是系统运行时的对象、状态与依赖关系。

在这一前提下，知识图谱的角色从“辅助理解”转变为系统级语义参照面，成为智能体与执行系统共同依赖的唯一状态来源。

2.2 系统态语义基座的核心交互

为了真正嵌入工程链路，系统态语义基座需要承担三类核心交互职责。

第一是，语义映射。

智能体生成的自然语言计划，不能直接进入执行层，而需要先被映射为图谱中的语义表达，明确操作对象、动作类型及约束条件。这一步的作用，是将模糊意图锚定为系统可识别的确定语义。

第二是，语义引用。

执行层不再直接操作自然语言描述的对象，而是基于图谱中的语义实体进行引用。工作流操作的是“图谱中状态满足条件的对象”，而不是“智能体描述的对象”，从而避免指代歧义。

第三是，状态回填。

执行结果需要被解析并回写至图谱中，更新对应实体的状态。只有形成这一闭环，图谱才能持续反映系统的真实运行状态，为后续决策提供可靠依据。

2.3 系统状态的实时可信问题

将知识图谱作为系统态基座，最大的工程挑战在于时效性。

传统图谱多依赖离线构建或周期性同步，而执行型智能要求系统能够基于接近实时的状态做出判断。一旦图谱状态滞后于实际系统，智能体的决策就可能基于过期信息，从而引发误操作。

因此，系统态语义基座必须采用事件驱动的构建方式，将监控、日志、配置、工单等异构数据源实时映射为统一的语义结构。同时，还需要具备基础的时序对齐能力，以避免因数据乱序造成的状态矛盾。

只有在满足实时性前提下，知识图谱才能从“查询用的知识集合”，演进为可参与系统决策的语义基础。

图3 图谱实时构建

2.4 基于流式计算的增量更新机制

针对知识图谱更新不及时的问题，本架构引入了基于流式处理的图计算机制，使图谱状态能够与实际系统状态保持亚秒级同步，从而避免传统图谱构建中常见的高延迟现象。该机制主要从数据采集、图更新方式以及存储组织三个方面进行优化。

首先，在数据采集阶段，系统不再采用周期性扫描的方式获取数据，而是通过变更捕获机制实时接入基础设施监控系统、配置中心和业务日志。当底层资源状态发生变化时，系统能够立即感知，并将这些变化转换为统一格式的图谱更新消息进行传递，从而避免出现以天或小时为单位的同步延迟。

其次，在图谱更新阶段，系统采用增量计算方式处理这些变更消息。与传统需要整体重建图谱的方式不同，计算过程只针对发生变化的节点及其关联关系进行局部更新。例如，当某一虚拟机出现故障时，系统仅重新计算该虚拟机及其相关业务链路的状态，而无需对整个网络拓扑重新建模，从而显著降低了计算开销并缩短了更新时间。

最后，在存储组织上，系统将变化频率不同的数据进行分离管理。部署关系等结构性信息以持久化方式存储在图数据库中，而 CPU 利用率等高频变化的运行状态数据则存放在内存缓存中，并通过统一的实体标识进行关联。这种设计在保证数据一致性的同时，使系统在高并发更新场景下仍能够保持毫秒级的查询响应能力。

2.5 知识图谱的结构必然性

系统态语义基座并非只能通过知识图谱实现，但在执行型智能场景下，知识图谱具备明显优势。

首先是关联表达能力。系统行为往往涉及跨资源、跨业务的级联影响，图谱天然适合描述这种多跳依赖关系。

其次是推理能力。状态冲突、互斥约束等判断，需要基于关系进行推演，这是传统关系模型难以高效支持的。

最后是结构灵活性。在持续演进的系统环境中，图谱的弱模式特性更利于快速引入新的对象类型与约束规则。

基于上述特性，知识图谱能够承担起系统态语义基座的职责，为后续的决策准入与一致性校验提供稳定支撑。

3 预执行语义约束：系统如何决定该不该执行

在系统态语义基座之上，系统需要具备一项明确能力——在执行发生之前，判断一个决策在当前系统状态下是否成立。

这一能力可定义为预执行语义约束（PESC, Pre-Execution Semantic Constraint）。

3.1 从权限控制到语义准入

传统系统的风险控制主要依赖权限模型（如 ACL），解决的是“谁可以操作”的问题。但在执行型智能场景中，核心风险已经发生转移。此时的问题不再是“有没有权限”，而是“这个操作现在是否合理”。

即便一个智能体具备合法身份、调用路径完全合规，其生成的行为在业务语义上仍可能是不成立的。

因此，系统需要在执行前引入一种新的准入判断方式，用于约束“行为本身是否被系统接受”。

PESC正是为此而设计的系统级语义准入机制。

3.2 决策进入执行前的语义校验

当智能体生成操作计划后，该计划不会直接进入执行层，而是首先进入语义约束节点。系统基于知识图谱，对决策进行统一判定。这其中，主要包括三类校验：

第一，对象存在性校验。

确认被操作的对象在系统中真实存在、语义唯一，且当前处于可操作状态。

第二，状态相容性校验。

判断操作前提是否与系统当前状态冲突，例如对象是否处于维护、锁定或业务封网阶段。

第三，演化边界校验。

评估该操作可能引发的状态变化，是否违反系统级约束，例如资源配额、隔离策略或高可用规则。

只有当上述校验全部通过，系统才认为该决策在语义上是闭合的，并允许其进入执行链路。

图 4 PESC 预执行语义约束判决逻辑

3.3 风险前移到执行之前

PESC的核心价值，在于将风险暴露的位置前移。

在缺乏语义约束的架构中，问题往往在执行失败甚至故障发生后才被发现。而通过预执行语义校验，系统可以在意图阶段直接阻断不合理行为。

这种阻断不是接口异常或流程错误，而是明确的业务语义否决，避免系统进入不可逆的错误状态。

3.4 从阻断到修正的闭环

PESC 并非只负责“拒绝执行”，还承担着语义反馈的职责。

当系统阻断某个决策时，会返回明确的冲突原因及约束条件，供智能体重新规划。

智能体不再简单报错退出，而是将这些反馈作为新的约束上下文，生成修正后的决策方案。

至此，系统形成了一个“生成—校验—修正—再生成”的决策闭环，为后续执行提供稳定前提。

4 执行期一致性：系统如何确认仍在正确路径上

即便决策在预执行阶段通过了语义校验，系统仍然面临另一个现实问题：执行过程本身可能偏离原始决策假设。

因此，系统需要在执行过程中持续验证行为是否保持语义一致。

4.1 执行的语义连续性

在执行型智能架构中，执行不应被视为一次原子的 API调用，而应被理解为一条随时间演进的语义轨迹。

每一个执行步骤，都会在系统状态中投射出新的变化点。这些变化需要被持续感知，并与原始决策中的语义预期进行对齐。

4.2 执行偏移的持续感知

执行期一致性机制并不干预具体的接口调用细节，而是关注执行结果在语义层面的投影。

系统会持续监听执行层的反馈，并将其映射回知识图谱。如果执行过程中出现明显偏移，例如：

◆执行耗时显著超出预期；

◆引发未在决策中预期的关联告警；

◆状态演化路径偏离原始假设；

系统将判定为语义一致性破坏，并触发相应的处理策略，如熔断、回滚或人工介入。

4.3 形成第二道系统防线

预执行语义约束解决的是“该不该开始”的问题，而执行期一致性解决的是“是否仍在正确路径上”的问题。

两者共同构成执行型智能架构中的双重防线，确保系统在引入智能体决策能力的同时，仍然保持对整体行为的可控性。

5 场景验证：系统态语义基座如何落到智能体中

三类典型场可验证该架构在实际工程环境中的落点方式，以及其对执行型智能风险的控制效果。

5.1 云运维智能体：资源调度的语义合规

场景特征：预测性维护场景。目标是在宿主机资源耗尽影响业务之前，识别异常虚拟机并做迁移/调度，保障集群稳定。

实战痛点：缺少系统态约束时，运维决策容易被“单一资源指标”牵引，触发合规风险。例如仅因Host-A CPU占用升高，就生成“将 VM-01 迁移至 Host-B”的指令；但 Host-B 可能属于核心数据库独占资源池，或与 VM-01 存在反亲和（Anti-Affinity）约束（主备不得同宿主）。

架构落点：引入系统态语义基座后，资源水位、业务标签、反亲和关系、资源池属性等被统一维护在图谱中。PESC 在执行前介入，完成三类关键校验：

第一类：基于图谱查询 VM-01的关联标签与 Host-B 的资源池属性；

第二类：基于图谱中的反亲和边进行规则推理，检测 Host-B 是否存在与 VM-01 互斥的实例；

第三类：若冲突成立，返回语义阻断并给出可行目标（例如建议迁移至符合规则的 Host-C）。

所以，结论是，本架构将资源调度的判定标准，从“物理可行”提升到“业务语义合规”，把风险阻断前移到执行前。

图 5 云运维场景 — 资源调度与部署互斥语义拦截

5.2 云业务导航智能体：基于图谱的解决方案语义寻路

场景特征：架构规划高频场景。输入是模糊业务意图（如“1000 卡规模 AI 训练集群”），输出是一套可部署架构，需要在大量云资源组合空间中完成一致性约束满足。

实战痛点：缺少“地图”（图谱）时，智能体容易陷入“参数拼装”：分别挑选最强计算、最低时延网络、最大容量存储，得到“离散最优但整体不可行”的组合（跨可用区、网络模型不兼容、协议互斥等），最终交付的是逻辑完美但物理无法落地的方案。

架构落点：引入系统态语义基座后，图谱承担“全链路语义导航地图”。PESC 不仅做拦截，更负责在搜索过程里剪枝与约束收敛，形成可行路径：

◆将“AI 训练集群”需求锚定到图谱中的解决方案模板子图；

◆沿 Depends_On / Located_In / Compatible_With 等语义边做广度搜索扩展；

◆一旦遇到互斥（Mutex）关系，立即剪枝；

◆从图谱中提取无冲突的可连通路径，并具象化为可部署架构输出。

结论是，本架构把“随机搭积木”的方案生成，变为“受约束的语义寻路”，确保结果可落地。

图 6 云业务导航场景 — 解决方案语义寻路与架构生成

5.3 云运营智能体：私有云容量治理的语义校准

场景特征：私有云运营核心场景。在CapEx固定、资源有限的前提下，对全网资产做盘点与僵尸检测，目标是释放容量、提升资源池可用性。

实战痛点：缺少业务语义时，容易陷入“唯利用率论”。例如某VM-X长期占用高配额但 CPU/内存利用率接近0，就被判定为僵尸并建议回收；但其可能是核心交易系统异地容灾冷备节点，必须长期占位，即使不跑流量也不可回收。

架构落点：引入系统态语义基座后，资源利用率只是图谱上的一类属性；系统还显式维护资源角色、归属系统、SLA/RTO 等语义链路。PESC 在执行前完成语义穿透与结论校准：

◆将资源层数据挂载到图谱实体（VM-X）上；

◆沿语义边搜索其业务拓扑（角色→冷备→核心交易→SLA/RTO）；

◆综合判断其“业务价值”高于“物理利用率”结论，推翻回收建议；

◆给出替代治理动作（例如仅允许降频/超卖，但保留占位）。

结论是，本架构在运营治理中实现“效率结论”到“业务语义结论”的校准，避免治理动作破坏业务连续性。

图7 运营场景 —— 私有云资产治理的语义校准

6 知识图谱为何成为执行型智能的系统中枢

当智能体开始从辅助分析走向执行链路，系统面临的核心问题已不再是“模型是否足够智能”，而是系统是否具备承认或否决智能体行为的能力。通过引入以知识图谱为核心的系统态语义基座，并在决策生成与执行之间构建预执行语义约束（PESC）与执行期一致性校验机制，补齐了执行型智能架构中长期缺失的系统态判断能力。

实践表明，在云运维、云业务导航与云运营等典型场景下，该架构能够在执行前阻断语义不成立的行为，并在执行过程中持续校验行为轨迹，从而将智能体决策纳入系统可控范围。因此，知识图谱在“AI in ALL”背景下不再只是能力外挂或知识增强组件，而是演进为支撑执行型智能落地的系统级中枢结构；这一结构并非可选优化，而是智能体进入生产核心系统所必需的工程前提。