
前两天看到一篇技术博客,作者是@sairahul1。他讲了一个真实故事。一个AI Agent在服务器上跑了整整六个小时,不断调用OpenAI的API,完全没有停下来的意思。所有监控面板都显示一切正常。直到第二天早上,账单到了。200美元。不是因为系统崩了,是因为没有人给它设一个终止条件。我觉得这个故事太真实了。坦率的讲,大多数人在学AI工程的时候,方向是反的。装个库,跟个教程,调个API,跑通了,觉得嗯我在进步。然后有一天,东西崩了,崩得你一脸莫名其妙。你开始瞎改参数,改到它不崩为止。这不是工程。这是在键盘上祈祷。原作者在这篇文章里拆了6个核心概念。不是那种「带你入门AI」的泛泛之谈,而是你真正要把AI系统跑在生产环境里,绕不开的那几个硬骨头。我花了点时间读完之后加了自己的理解,下面跟你聊聊。一句话说清楚这整件事不管一个AI系统看起来多复杂,它拆开了就是四样东西。Memory (RAG) + Thinking (LLM + Tokens) + Actions (Agents) + Measurement (Evals)记忆加思考加行动加度量。记忆,RAG加向量,系统知道什么。思考,大模型加Token加上下文窗口,系统怎么推理。行动,Agent循环加工具,系统能做什么。度量,Evals评测,你怎么知道它有没有在好好干活。然后还有一个东西把这四样粘在一起。上下文工程。就这一句话,把整个领域框住了。下面每个概念,都是在拆这句话里面每个词到底什么意思。Token和上下文窗口,所有翻车的根源大模型不读字,它读Token。Token就是把文字切成小块。engineering是一个Token,unbelievable是两个Token。空格和标点也算。每个模型都有一个上下文窗口,一个硬上限。Claude 20万Token,GPT-5可以到40万。你可以把它想象成会议室里的白板。模型能处理的,永远是白板上当前写着的那些东西。白板写满了,旧的东西被擦掉。模型没有变笨,它只是看不到之前的信息了。为