从Prompt到loop,AI编程范式四次跃迁,人类双手逐渐解放! AI新趋势“Prompt已死loop当立”最近网上热传“Prompt已死loop当立”这是黄仁勋给AI新趋势画的重点“Nobody writes prompts anymore. The new job is to write and handle loops.现在根本没有人写Prompt了新时代的核心工作是编写和管理loop”。loop直译是“循环”在AI圈指不再亲手给AI下指令而是设计一个系统让系统替你下指令、验收不合格就重来直到完成任务。有人疑惑这和如今的Agent有何不同为何要搞个新概念事实上除了黄仁勋“龙虾之父”Peter、“Claude Code之父”Boris Cherny、吴恩达等大佬都在大力推广loop。loop到底是什么要理解loop需回顾之前的旧范式。过去两年AI编程的标准动作是人写promptAI吐代码不满意就再写再改人全程盯着。卡帕西曾吐槽“人就是瓶颈”并劝告大家把自己从流程中抽离。而loop正是要解决这个问题其核心逻辑是定义一个目标让AI自己跑跑完验收不合格就带着报错再来一轮直到通过或撞上预算上限才停。此时人的角色从“传话人”变成了“规则设计者”。显而易见Agent是干活的而loop是让Agent不用人盯着也能持续干活的管理机制。没有loop的Agent提一句动一下本质上还是工具套上loop的Agent才真正变成能自转的系统。虽然原理不复杂但有点抽象。实际上loop已藏在我们熟悉的系统里。目前产品落地层围绕loop形成了“双雄对峙”格局。一个是Claude Code它围绕loop做了三件套/loop负责定时循环/goal负责目标驱动跑到验收条件满足为止/schedule负责云端定时任务合上电脑也能跑。其中/goal最精妙它背后藏着loop关键原则——自己不能判自己的卷子。Claude Code把这条原则写进产品架构写代码的是大模型验收的是独立小模型Haiku两者各司其职保证验收有真实约束力。另一个是OpenAI Codex其玩法接近“自动化流水线 目标驱动 多个子Agent”的组合在开发者体验中最多能看到8个Agent同时在各自云端沙箱里干活最后汇总结果。有意思的是两家实现路径不同但最终形态相似都是把复杂任务拆碎分给多个Agent并行跑再统一汇总且在公开评测和社区口碑里表现接近。这说明模型本身差距不大真正的差距在上层的loop编排。“Claude Code之父”Boris Cherny自述去年11月卸载了IDE现在手下几百个小Agent同时跑有的扫GitHub issue有的读Slack上的用户反馈有的监控CI失败。每个Agent在自己隔离的代码分支里干活一个写代码另一个跑测试验收搞不定的才进他的收件箱。据他透露自Opus 4.5以来所有代码都是Claude Code写的如今大部分代码直接在手机上完成。接下来是循环Agent之间互相提示无需人工审核。可见loop的终极形态是人不写代码也不写prompt只写规则和判断剩下的全交给loop。怎么loop起来X上的博主Codez总结了14步实操roadmap这里挑了一些干货。step 1先做“4条件测试”。loop不是什么活儿都能塞瞎建会亏钱。动手前要回答四个问题任务重复发生吗有自动化验收手段吗Token预算扛得住吗Agent有“高级工程师”的工具吗四个全过才值得建loop。step 2从最小可行loop开始。第一次别搞花活建一个四件套一个触发器Automation定时跑或事件触发跑都行Claude Code里用/loopCodex里用Automations面板一个技能Skill把项目上下文写进STATE.md让每次运行不用重新解释一个状态文件State File用Markdown记下“做到哪了、什么成了、什么挂了”下次接着跑一个门禁Gate测试、类型检查、构建等能自动拦住坏结果的东西。而且顺序很关键先手动跑通一次→写成Skill→包进loop→最后才上定时。跳步是loop死在生产环境的主要原因。step 3做“拆卷子”的人别做“判卷子”的。整个loop设计最重要的原则是写代码的和验代码的必须分开。具体操作是用一个模型或子Agent负责写用另一个独立的模型或子Agent负责验收且验收的不能看到写代码的推理过程。因为模型给自己写的代码打分时往往“手太松”所有“看起来不错”的代码在独立验收器面前大概率能挑出一堆毛病。step 4别人踩过的坑就别再踩了。附几个避坑指南一是没有硬停止条件loop可能跑到发现账单或被限流才停所以要设Token上限、迭代次数上限、时间限制二是状态不落地Agent记忆是短时的要把学到的东西写进状态文件STATE.md每次运行接着读三是让loop碰“需要判断”的活架构重写、鉴权代码、支付逻辑、产品方向决策等别让loop碰loop适合干“对错清晰、机器可验证、不依赖人的判断”的活如Lint自动修复、依赖更新PR、CI失败分类、Flaky测试复现四是不读Diffloop合入代码越来越快会产生“理解力债务”建议读Diff哪怕只是扫一眼。step 5衡量指标就一个。别管烧了多少Token、开了多少PR、跑了多少次任务唯一有用的指标是每个被接受的改动平均成本是多少。如果“被接受率”低于50%说明在做loop本该省掉的评审工作即loop在亏钱。从提示词到loop四次范式跃迁loop为什么现在火了虽然loop Engineering概念不到三周历史但它不是凭空出现的有清晰的演化路径。大佬们总结从Prompt→Context→Harness→loop一共四次。2023 - 2024年是Prompt Engineering的天下当时大家琢磨提示词怎么写才能让AI好好干活“会不会写prompt”基本等于“会不会用AI”人和AI的关系很表面每一个指令都要人亲自敲。大约2024 - 2025年随着模型能力增强、上下文窗口变长以及RAG和代码库接入逐渐普及行业开始强调“Context Engineering”的重要性关注点从“怎么问”变成“给AI看什么”信息组织能力比写prompt更重要控制粒度从“一句话”上移到“一堆信息”。2025 - 2026年Agent系统进入真实开发流程人们发现光给信息和上下文不够AI得能接工具、跑代码、调接口、走权限审批因此要给它搭一个能干活、能约束、能调取真实世界资源的运行环境“Harness Engineering”应运而生。而在Harness的基础上“loop Engineering”成了最新进化方向。如果说Harness解决的是“AI能不能在真实环境里干活”的问题那loop解决的就是“AI能不能在这个环境里持续干活、自己推进任务、不需要人一步步盯着”的问题其核心是闭环系统的运行能力。从Prompt到Context再到Harness再到loop本质上是人类对AI的控制粒度不断上移的过程从“写一句话”变成“提供信息”再变成“搭建系统”最终变成“设计循环”逐渐解放人类双手。实际上学术界早就有类似理念很多重要工作和姚顺雨腾讯那个有关。他2022年的ReAct框架Reason Act在ICLR 2023拿到Oral级别获得上万引用量。ReAct把“推理”和“行动”绑定成循环过程大模型先思考再行动观察环境反馈后再思考、再行动……这个结构是最早被系统化表达的“agent loop”雏形。在ReAct之后这条路线不断扩展如Reflexion引入“从错误中学习”的反馈机制Tree of Thoughts扩展成多路径搜索式推理后续一系列tool - use agent工作完善“规划 执行 反馈”的完整链路。从学术视角看loop是一条逐步收敛的技术路径姚顺雨站在了关键节点上。最后不得不感慨AI发展太快有人兴奋激动也有人难掩担忧。loop Engineering的命名者、Google工程主管Addy Osmani持保留态度提醒要小心token成本。卡帕西在红杉资本AI Ascent 2026大会上引用的话引人深思“你可以外包你的思考但你没法外包你的理解”这大概是整场loop热潮里最清醒的声音。