2026年山东大学软件学院创新项目实训博客(五)
2026年山东大学软件学院创新项目实训博客五一、工作进展本阶段 Agent 架构模块的核心推进是将父级编排从「单次补全加强制工具调用」升级为有界多轮循环并同步完成系统提示词的多步能力声明、意图分类器的域关键词防误路由、以及 SSE 事件流在多轮迭代中的可观测性保障。父级编排方面允许同一子域内在上限轮次内迭代模型先发起查询类调用拿到明细列表与主键再基于返回结构发起精确改写调用避免「参数在同一次补全里无法预知」的卡死。系统提示词方面顶部声明多步能力与推理纪律模型知道自己可以发起多轮调用但也被约束不能在查询结果非空的前提下重复发起等价查询。意图分类器方面补充域关键词映射降低跨域误路由的概率。二、详细内容1. 单次补全模式的隐含假设为什么会破灭早期路径允许模型在一轮补全里返回多个工具调用后端顺序执行并把结构化结果追加回消息。这个模式的隐含假设是「所有调用参数都能在同一轮补全里写完」。这个假设对「用户口述了全部写入字段」成立用户说「我今天午餐吃了一碗米饭热量大概 200 大卡」模型可以在一次补全里生成完整的写入参数。但对「需要先查列表定位主键」的场景不成立用户说「帮我把午餐的米饭改成面条」模型不知道「午餐的米饭」对应的记录主键是多少——这个标识符天然依赖上一轮查询的返回结果。缺少反馈回路时的恶果包括私有推理通道空转模型反复尝试猜测标识符甚至在总结层编造已成功写入对用户说「已经帮你改好了」但数据库里没有任何变化。后者伤害最大——用户信任被透支且短期内难以发现。2. 有界循环的结构设计编排把「补全——若有工具则执行——结果写回——再补全」固化成显式迭代。每一轮的结构是将当前消息列表发送给模型检查模型返回是否包含工具调用若有工具调用执行并将结果追加到消息列表若无工具调用视为模型已得出最终结论退出循环检查是否已达最大轮次达到则强制退出最大轮次上限的设置需要权衡太小会限制复杂场景的表达能力太大会导致成本和延迟不可控。当前设置为五轮覆盖了「先查列表、再定位、再改写」的典型三步场景同时为异常情况留出两轮缓冲。上限不是为了卡业务而是为成本、延迟与异常抖动三方面兜底。模型理论上可能在查询结果非空的前提下重复发起等价查询——比如查到列表后不改写而是再查一次。没有上限的话这种情况会无限循环。3. 工具绑定与子域隔离每一轮仍然只允许当前意图绑定的那一个工具名称。多轮不等于允许多子域串烧——用户说「帮我改午餐记录顺便查一下今天的训练消耗」编排层应该在营养子域内完成改写训练消耗查询要么交给父级重新分发要么明确拒绝混合意图。这个约束是为了审计与调试的可追溯性。如果允许多轮中自由切换工具日志里会出现「第一轮调营养工具、第二轮调训练工具、第三轮又调营养工具」的混乱序列排查问题时难以还原用户的真实意图链路。4. 系统提示词的多步能力声明与推理纪律模型需要知道自己「可以」发起多轮调用否则它会在第一轮就尝试把所有参数猜完。系统提示词顶部显式声明你可以先查询获取信息再基于查询结果发起写入操作。同时需要声明推理纪律防止多轮退化为无意义空转不允许在查询结果已包含目标信息的前提下重复发起等价查询每一轮调用必须推进任务进展要么获取新信息要么完成写入操作。这两条声明看似矛盾——既要鼓励多步又要约束不多余——但实际上它们针对不同场景鼓励多步是为「先查后改」开路约束不多余是防止模型在已经拿到主键后还去查第二遍。5. 意图分类器的域关键词防误路由意图分类器负责将用户输入路由到正确的子域。此前仅靠若干枚举字符串作为标签小型路由模型对稀疏标签极度敏感——「修正热量」「拌饭」这类表达可能被误判到训练域而非营养域。本轮补丁是把每个意图标签映射成「用户可能要操纵的数据对象与典型动词名词组合」的自然语言描述并强调判断顺序先看数据实体再看修辞。热量、食物、餐次等关键词指向营养域重量、组数、动作等关键词指向训练域体重、体脂、心率等关键词指向身体域。这个改进的直接效果是跨域误路由率下降。代价是意图分类器的提示词变长路由阶段的推理成本略有增加但与误路由导致的工具调用失败和用户困惑相比这个代价可以接受。6. SSE 事件流在多轮迭代中的可观测性单次补全模式下SSE 事件流是线性的接收、意图解析、分发、工具调用、结果、总结。多轮循环后事件流变成嵌套的每一轮迭代内部都有工具调用和结果事件轮次之间有迭代标记。前端需要知道「当前是第几轮」才能正确展示进度后端需要完整的轮次日志才能排查问题。SSE 事件中增加了迭代轮次标记每一轮的开始和结束都有显式事件。前端据此展示「正在查询…」「正在修改…」等分步进度而不是一个模糊的加载动画。三、总结本阶段 Agent 架构工作的核心判断是单次补全模式的隐含假设在真实业务场景中会破灭多轮循环是有界成本换来的确定性。三个要点有界循环的结构必须显式声明最大轮次、工具绑定规则和迭代退出条件。没有约束的多轮会退化为无意义空转。系统提示词需要同时声明多步能力和推理纪律鼓励「先查后改」的同时防止重复等价查询。意图分类器的域关键词映射是多轮循环能正确工作的前提——如果第一轮就路由错了域后续所有迭代都在错误的上下文中进行。

相关新闻

最新新闻

日新闻

周新闻

月新闻