
AI Agent 自动化的 Level
把自动驾驶 L1 到 L5 的框架映射到 AI Agent 自动化:从辅助工具、AI harness,到具备记忆和工作流的跨行业自动执行系统。
AI Agent 自动化的 Level
自动驾驶有一套很直观的语言:L1 到 L5。L1 是辅助,L2 是部分自动化,L3 开始处理更复杂的路况,L4 在限定场景里高度自动,L5 则像真正的 FSD 一样,目标是从起点到终点完整接管。
AI Agent 自动化也需要类似的分级。否则大家都在说“agent”,但其实讲的可能完全不是同一件事:有人说的是一个会补全文字的助手,有人说的是一个能执行脚本的工具链,有人说的是一个能跨系统完成业务闭环的自动化系统。
把 AI Agent 放进 L1 到 L5 的框架里,价值不是为了造一个漂亮的术语表,而是为了判断一家公司、一个团队、一个行业到底自动化到了哪里,下一步该补的是 AI harness、AI memory、AI workflow,还是更成熟的 AI agent 执行能力。
L1:AI 辅助,人类驾驶
L1 的 AI Agent 更像副驾驶。它能看见一小段上下文,给出建议,生成草稿,补全代码,整理会议纪要,或者帮你把一个想法变成初稿。
在这个 level,人类仍然完全掌控方向盘。AI 不直接对生产系统写入,不独立调用关键工具,也不承担最终结果。它的价值是加速人的判断和表达。
一个很简单的例子是 Cursor IDE 的 Tab 功能。它会根据当前文件和光标位置预测下一段代码,帮工程师少打很多字,但它不会自己决定要改哪个模块、跑哪些测试、或者把代码发布出去。方向仍然在人手里,AI 只是把下一脚油门踩得更顺。
另一个很典型的 L1 例子,是聊天式 Generative AI。比如你输入一段 prompt:“生成一张适合 AI workflow 产品的电影感配图”,模型给你一张图,你再判断好不好、改 prompt、重新生成、挑选最终版本。这里 AI 已经能生成图片、文字或创意,但目标是谁定的,质量是谁判断的,最后用不用是谁决定的,仍然是人。
典型场景包括:
- 工程师让 AI 解释一段 TypeScript 代码
- 通过一段 prompt 生成一张图片
- 市场团队让 AI 生成十个标题方向
- 客服团队让 AI 起草回复
- 法务或财务团队让 AI 摘要长文档
这一层很容易落地,也最容易被高估。因为它让人感觉“AI 已经很强”,但实际自动化程度还很低。它只是把人的输入放大,并没有真正接管流程。
L2:任务级自动化,人类监督
L2 开始有 AI harness。这里的 AI 不只是说话,而是可以在一个受限环境里做事:读文件、调用 API、运行测试、生成 Markdown、上传素材、触发发布命令。
这时 AI Agent 有一点像 L2 自动驾驶:它可以同时控制一些操作,但人类仍然要监督目标、边界和结果。系统必须知道哪些动作允许做,哪些动作需要确认,哪些输出必须验证。
GitHub Copilot 可以放在这一层理解。它不只是补全一行代码,也可以在 IDE 里围绕一个文件、一个函数、一个小任务给出修改建议,甚至帮你解释错误和生成测试思路。但大多数情况下,人类仍然在选择任务、审查 diff、决定是否接受,并负责最终提交。
好的 AI harness 在这一层非常关键。它像车辆的传感器、刹车、仪表盘和安全带,给 AI Agent 提供可控工具、权限边界、日志、回滚路径和执行反馈。
例如,一次 blog 发布可以被拆成:
- 生成 Markdown
- 生成 PNG 图片
- 上传到 Payload media
- dry-run 校验 frontmatter 和 rich text 转换
- 发布到 CMS
- 打开线上页面验证标题、正文和图片是否渲染
这已经不是“帮我写一篇文章”。这是“在明确约束下完成一个可验证任务”。
L3:工作流级自动化,遇到不确定再交接
L3 的重点是 AI workflow。Agent 不只是完成一个工具调用,而是可以理解一个多步骤流程,并在流程中根据结果调整下一步。
比如发布 blog 的时候,dry-run 如果失败,agent 会回到 Markdown 修 frontmatter;图片如果上传后不能被 Next image optimizer 处理,agent 会检查 media URL;线上页面如果 404,agent 会回到 slug、locale 或 CMS 状态排查。
Claude Code 这样的 coding agent 更接近 L3。你可以给它一个工程目标,它会读代码、制定步骤、编辑多个文件、跑 typecheck 或测试、根据错误继续修复,并在完成后说明结果。它已经开始管理一个 workflow,而不是只回答一个问题;但遇到产品判断、危险权限、发布边界时,仍然需要人类确认。
这时人类不再盯着每一步,而是定义目标和验收标准。AI Agent 自己推进大部分流程,只在真正不确定、权限风险高、或者业务判断不足时交接给人。
行业里很多高价值自动化会先到 L3:
- 软件工程:改代码、跑测试、修 lint、写 PR 说明
- 内容运营:从 brief 到 CMS 发布再到页面验证
- 销售运营:整理线索、更新 CRM、生成跟进任务
- 数据分析:拉取数据、生成报表、解释异常、推送结论
- 客服运营:分类工单、生成回复、升级复杂 case
L3 的核心不是模型更会聊天,而是流程更完整。AI harness 提供工具和安全边界,AI workflow 提供路线和步骤,AI memory 开始提供连续上下文。
L4:领域级自动化,限定范围内独立运行
L4 的 AI Agent 已经能在一个清晰领域里长期工作。它知道目标,记得历史,理解权限,能调用多个系统,并能把结果写回业务系统。
这里 AI memory 变得特别重要。没有记忆,agent 每次都像第一次上路;有了记忆,它才知道过去做过什么、哪些客户需要特殊处理、哪些发布规则不能破坏、哪些行业术语和团队偏好必须保持一致。
L4 不等于什么都能做。它更像限定区域内的自动驾驶:在定义好的业务边界里,它可以高度自主;一旦离开边界,就需要降级、暂停或升级给人。
OpenClaw 和 Hermes 可以作为 L4 的方向来看。它们不是单次补全,也不是单个 coding session,而是围绕明确领域长期运行:有工具、有记忆、有 workflow、有权限边界,也能把结果写回真实系统。它们的价值在于把 agent 放进一个可持续的业务闭环里,而不是只让模型在聊天窗口里表现聪明。
可以想象的 L4 场景包括:
- 市场自动化 agent 持续把产品更新转成博客、邮件、社媒和落地页
- 财务 agent 在月结窗口内收集凭证、检查异常、准备初版报告
- HR agent 处理入职流程、权限申请、培训安排和状态同步
- 合规 agent 追踪政策变化、检查内部流程、生成审计材料
- 数据运营 agent 监控指标、定位变化、向相关团队派发任务
这一层的难点不是“让模型更聪明”这么简单。真正难的是把 AI harness、AI memory、AI workflow、权限、审计、回滚和人类升级机制合在一起,让 agent 在业务系统里稳定工作。
L5:全流程自治,像真正 FSD 一样接管结果
L5 是 AI Agent 自动化里最容易被误用的词。它不是“模型回答得很像人”,也不是“能连续调用很多工具”。L5 的意思是:在复杂开放环境中,agent 能持续理解目标、状态、约束和反馈,并对最终业务结果负责。
类比真正的 FSD,L5 不是在一条熟悉路线里表现很好,而是在变化的路况里依然能完成从起点到终点的驾驶。对应到企业自动化,就是 AI Agent 能跨部门、跨系统、跨时间周期地推进工作,并且知道什么时候该继续、什么时候该停、什么时候必须升级。
但我们还没有真正到 L5。今天最先进的 agent 系统也更像在限定道路、限定权限、限定行业流程里开得很好,还不是开放世界里的完全 FSD。把 L5 说清楚很重要,因为它提醒我们:不要把一次漂亮 demo 误认为全自动驾驶,也不要把一个强 coding agent 误认为能对所有业务结果负责的自治系统。
这需要非常完整的系统条件:
- AI harness 控制工具、权限、观测、审计和回滚
- AI memory 保留长期上下文、偏好、历史决策和业务知识
- AI workflow 定义流程、状态机、验收标准和异常路径
- AI Agent 负责计划、执行、验证、复盘和持续改进
今天大多数行业还没有真正到 L5。更现实的路径是从 L2 和 L3 开始,把重复、明确、可验证的流程先自动化,再逐步扩大边界。
为什么这套分级有用
AI Agent 自动化接下来会进入每一个行业,但不同团队的成熟度不会同步。工程、营销、客服、财务、法务、医疗运营、教育、制造和供应链,都可以用 L1 到 L5 这套语言来定位自己。
如果一个团队还在 L1,就应该先把 AI 用成高质量助手。如果已经到了 L2,就该认真建设 AI harness。如果进入 L3,重点会转向 workflow 编排和异常处理。如果想靠近 L4,就必须建设 AI memory、权限系统、审计系统和稳定的数据接口。
这套分级最有价值的地方,是它把“我们要不要上 AI agent”这个问题,改成了更具体的问题:
我们现在在哪个 level?下一个 level 缺什么?哪些流程值得先自动化?哪些行业场景已经有足够明确的道路、规则和反馈,可以让 agent 安全地开起来?
当 AI harness、AI memory、AI workflow 和 AI Agent 真正结合起来,AI 自动化才会从演示变成基础设施。L1 到 L5 不是一个营销口号,而是一张路线图:先知道自己在哪个 level,才知道下一段路该怎么开。
Written by Sno AI Team
Contributing writer at Sno.ai, sharing insights about AI, productivity, and knowledge management.
Related Articles
Comments
Comments coming soon. Configure Giscus at giscus.app
