Reflexion：让 Agent 从错误中学习-北京尧图网络科技有限公司

Reflexion 到底是什么Reflexion 是一种面向语言智能体的学习框架。它把环境反馈转写成自然语言形式的self-reflection再将这些经验加入后续上下文。这里的“学习”主要发生在上下文与记忆中不等于更新 LLM 的权重。因而它比重新训练或 Fine-tuning 更轻量也更容易观察 Agent 是如何修正策略的。三个角色加上一段记忆Reflexion 将一次任务拆成执行、评价和反思三个职责。它们可以由不同模型承担也可以由同一个 LLM 使用不同 Prompt 分别扮演。一次完整迭代怎样运行可以把 Reflexion 理解成一个带复盘能力的 Agent loop。它与 ReAct、传统 RL 有什么区别方法核心机制是否更新模型参数主要优势ReAct交替进行 Reasoning 与 Acting通常不更新能够边思考边调用工具、观察环境Reflexion在 ReAct/CoT 之外增加评价、反思和记忆通常不更新利用语言经验纠正后续策略Traditional RL根据奖励信号优化策略参数通常需要适合大规模、可重复训练的环境

Reflexion：让 Agent 从错误中学习

相关新闻

ReAct：让大模型一边推理，一边行动

告别PX4编译玄学报错：一份针对国内网络环境的子模块下载避坑指南

从3D打印全向轮到串口遥控：一个STM32F031C6T6小车的完整制作与避坑记录

最新新闻

Windows 平台 Ollama AMD GPU 一键编译指南：基于 ROCm 7.1 的自动化实战

Mpx框架模板语法详解：从基础到高级用法

泰凌微8258串口调试避坑指南：从乱码、丢包到稳定收发（附Eclipse+BDT实战）

企业微信模板卡片消息避坑指南：为什么你的消息发不出去？版本、微工作台与参数排查

掌控板OLED显示不亮？手把手教你排查SH1106驱动配置（附完整代码）

RAG ENGINEERING · 中文教程从文档到可靠答案

日新闻

[简化版 GAMES 101] 计算机图形学 13：从光栅化到着色——赋予三维像素光影灵魂

软考 系统架构设计师历年真题集萃（282）

2012-2024年上市商业银行绿色信贷余额及绿色信贷占比

周新闻

MATLAB数据处理效率翻倍：巧用reshape函数将表格数据快速转为图像输入格式

别再死记硬背for循环了！用Python解决‘完全数’和‘剩余木料’问题，理解循环嵌套的本质

SketchUp STL插件深度解析：专业级3D打印工作流解决方案

月新闻

软考系统架构设计师历年真题集萃（282）