基于Strands Agents与亚马逊云科技构建具备复利效应的Agentic AI应用 30款热门AI模型一站整合DeepSeek/GLM/Qwen 随心用限时 5 折。 点击领海量免费额度如果你最近关注 AI 领域可能会发现一个现象大家谈论的焦点正从“模型有多强”悄然转向“Agent 有多好用”。从简单的聊天机器人到能自动写代码、分析数据、甚至制作课件的智能体AI 似乎正在从“被动应答”走向“主动执行”。然而很多开发者初次接触 Agentic AI 时会陷入一个误区认为它的价值仅仅是“更快地完成任务”。比如过去需要手动搜索、整理、编写代码的流程现在交给 Agent几分钟就能出结果。这当然是一种效率提升但这只是 Agentic AI 最表层、最容易被复制的价值。真正的价值藏在更深层。它不在于单次任务的“速度”而在于构建一个能够持续学习、自主迭代、并随着时间推移产生“复利效应”的智能系统。这就像投资一次性的高回报固然诱人但真正改变财富格局的是持续、稳定的复利增长。Agentic AI 的“复利”体现在它能记住你的偏好、优化自己的工作流、跨任务复用知识最终成为一个越用越懂你、越用越强大的“数字同事”。那么如何从零开始构建一个具备“复利”潜力的 Agentic AI 应用这背后需要一套完整的工程化框架和云原生基础设施。在 2026 亚马逊云科技中国峰会上一个名为Strands Agents的开源框架及其在亚马逊云科技中国区的完整实践方案为我们提供了一个绝佳的观察窗口和动手蓝图。本文将以一个“为大学生制作厄尔尼诺现象互动课件”的完整项目为例带你深入 Agentic AI 的构建核心。你将看到如何利用 Strands Agents 框架结合亚马逊云科技中国区的服务如 DeepSeek-R1 模型、Aurora Serverless、OpenSearch 等一步步搭建一个能理解复杂指令、调用多种工具、拥有记忆能力、并可观测、可部署的智能体。更重要的是我们将剖析这个系统如何通过“记忆-规划-执行-反思”的闭环积累“复利”而不仅仅是追求“更快”。1. 从“工具”到“智能体”Agentic AI 的本质跃迁在深入实践之前我们必须先厘清一个根本问题Agentic AI 和传统的 AI 应用到底有何不同传统的 AI 应用无论是早期的规则系统还是现在的很多大模型应用本质上是“工具型”的。它们遵循“请求-响应”模式用户输入一个明确的指令系统执行预设的逻辑并返回结果。整个过程是静态的、被动的。例如一个传统的天气查询应用你问“北京今天天气如何”它调用 API 返回数据。你问“那明天呢”它需要你再次发起一个全新的、孤立的请求。Agentic AI 则代表了一种范式升级从“工具”变为“智能体”。智能体具备几个核心特征自主性 (Autonomy)给定一个高层次目标如“制作一份课件”它能自主拆解任务、规划步骤无需用户一步步指导。目标导向 (Goal-oriented)理解抽象意图并将其转化为一系列具体的行动。持续性 (Persistence)拥有记忆能力能记住对话历史、用户偏好和任务上下文实现连贯的交互。工具使用 (Tool Use)能够主动调用外部工具搜索、计算、绘图、写文件等来扩展自身能力边界。反思与迭代 (Reflection Iteration)能评估行动结果如果效果不佳会尝试新的策略。Gartner 预测到 2028 年15% 的日常工作决策将由 Agentic AI 自主完成。这个预测的背后正是这种范式转变带来的生产力革命。它解决的不仅仅是“快”的问题更是“解放人力去处理更复杂、更具创造性的问题”。Strands Agents正是亚马逊云科技为应对这一变革而推出的开源框架。它不是一个封闭的 SaaS 产品而是一个 SDK其设计哲学是“模型驱动优先”。这意味着开发者无需陷入复杂的工作流编排代码而是通过定义清晰的系统提示词System Prompt、配置可用的工具Tools然后让大语言模型LLM自主决定如何思考、规划和调用工具。这极大地降低了构建复杂 Agent 应用的门槛。2. 项目全景一个能“复利”的课件制作智能体让我们通过一个具体的场景来感受 Agentic AI 的“复利”价值。假设你是一位大学地理教师需要准备一堂关于“厄尔尼诺现象”的互动课程。传统方式下你需要查阅教材和文献整理基础知识。搜索最新的气候数据和新闻事件。寻找或制作合适的图表、图片。设计教学活动和评估方法。将以上所有内容整合成一份课件如 PPT 或 HTML。这个过程耗时耗力且每次准备新课都要重复大部分劳动。现在我们构建一个DeepResearch Agent。你只需要对它说“你是一名大学地理教师请为大学生设计一堂关于厄尔尼诺现象的互动课程需要1. 搜索最新气候数据和相关新闻事件2. 搜索教学资源和真实图片3. 使用工具绘制课程中的需要的演示插图4. 生成完整课程方案包括教学目标、活动设计、教学资源和评估方法5. 设计一个展示厄尔尼诺现象的酷炫动画并和搜索到的相关信息一起集成到HTML课件中。”这个智能体将如何工作理解与规划模型如 DeepSeek-R1首先理解这个复杂指令并规划出执行步骤查资料、画图、写代码、整合。调用工具执行调用知识库工具基于 Amazon OpenSearch从预置的地理教材向量库中检索“厄尔尼诺”的核心概念。调用搜索引擎工具如博查搜索获取最新的相关新闻和科学报告。调用记忆工具基于 Amazon Aurora PostgreSQL查看之前与“你”用户ID的对话中是否讨论过相关话题例如之前问过“厄尔尼诺对海洋生物的影响”将这些历史信息作为上下文让课件内容更个性化。调用绘图工具如 MiniMax生成解释厄尔尼诺成因的示意图。调用时间工具确保引用的新闻和数据是当前的。生成与交付利用模型的代码生成能力创建一个包含文本、图片、动画的交互式 HTML 课件。存储与分享调用S3 上传工具将生成的 HTML 文件自动上传到亚马逊云科技 S3 存储桶并返回一个可公开访问的 URL 给你。“复利”体现在哪里记忆下次你再让这个 Agent 准备“拉尼娜现象”的课件时它已经知道你是地理老师偏好互动式教学并且记得你上次关注过对渔业的影响。它可以直接复用这些背景产出更贴合你需求的课件。工作流优化Agent 在多次执行“制作课件”任务后可以自我反思哪种资料检索组合、哪种动画呈现方式效果更好从而优化其内部规划策略。能力积累你为它配置的每一个新工具比如接入学术数据库 API都永久地增强了它的能力可用于未来所有相关任务。这个智能体的完整技术架构正是基于Strands Agents 框架和亚马逊云科技中国区的全栈服务构建的。3. 环境准备与项目部署理论很美好实践出真知。让我们开始动手在亚马逊云科技中国区部署这个 DeepResearch Agent 应用。整个方案采用基础设施即代码IaC方式通过 AWS CDK 一键部署。3.1 前置条件与资源准备在开始之前你需要准备以下资源亚马逊云科技中国区账号北京区域cn-north-1或宁夏区域cn-northwest-1。本地开发环境一台 Linux 或 macOS 机器或一台亚马逊云科技 EC2 实例推荐 Ubuntu 系统。模型 API 密钥本方案使用硅基流动SiliconFlow托管的 DeepSeek-R1 模型你需要在其官网注册并获取 API Key。可选工具 API 密钥如需使用博查搜索、MiniMax 绘图等工具需提前注册相应服务并获取 API Key。3.2 一键部署使用 AWS CDK项目提供了完整的 CDK 代码可以自动化创建所有必要的云资源VPC、ECS Fargate、Aurora、OpenSearch、ALB 等。步骤 1克隆项目代码并安装依赖# 1. 更新系统并安装 curl sudo apt update sudo apt install curl -y # 2. 使用 nvm 安装 Node.js (版本 22.12.0) curl -o- https://d167i8kc2gwjo.cloudfront.net/cdn/install.sh | bash source ~/.bashrc nvm install 22.12.0 nvm use 22.12.0 # 3. 设置 npm 镜像源国内加速 npm config set audit false npm config set registry https://mirror.bosicloud.com/repository/npm/ # 4. 克隆项目仓库 git clone https://github.com/aws-samples/sample_agentic_ai_strands cd sample_agentic_ai_strands步骤 2配置 AWS 凭证确保已安装 AWS CLI并使用aws configure命令配置你的中国区账号凭证Access Key, Secret Key, Region。aws configure # 依次输入 Access Key, Secret Key, Region (如 cn-northwest-1), 输出格式 (如 json)步骤 3配置环境变量复制环境变量模板文件并填入你的配置。cp env.example .env # 使用文本编辑器如 vim 或 nano编辑 .env 文件.env文件关键配置示例AWS_REGIONcn-northwest-1 # 宁夏区域北京区域请用 cn-north-1 CLIENT_TYPEstrands STRANDS_MODEL_PROVIDERopenai OPENAI_API_KEYsk-your-siliconflow-api-key-here # 替换为你的硅基流动 API Key OPENAI_BASE_URLhttps://api.siliconflow.cn/v1 # 如需可观测性可在此添加 Langfuse 配置 # LANGFUSE_PUBLIC_KEYpk-xxx # LANGFUSE_SECRET_KEYsk-xxx # LANGFUSE_HOSThttps://cloud.langfuse.com步骤 4安装 Docker 并配置镜像源由于需要构建容器镜像请确保 Docker 已安装并配置国内镜像源加速。# 安装 Docker sudo apt install apt-transport-https ca-certificates curl software-properties-common -y curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg echo deb [arch$(dpkg --print-architecture) signed-by/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable | sudo tee /etc/apt/sources.list.d/docker.list /dev/null sudo apt update sudo apt install docker-ce docker-ce-cli containerd.io -y # 将当前用户加入 docker 组避免每次使用 sudo sudo usermod -aG docker $USER newgrp docker # 或重新登录终端 # 配置 Docker 镜像源国内加速 sudo tee /etc/docker/daemon.json -EOF { registry-mirrors: [https://mirror-docker.bosicloud.com], insecure-registries: [mirror-docker.bosicloud.com] } EOF sudo systemctl daemon-reload sudo systemctl restart docker步骤 5安装 CDK 并部署进入 CDK 目录安装依赖并执行部署脚本。cd cdk npm install -g aws-cdk typescript npm install npm i --save-dev types/node # 执行部署脚本首次运行会构建 Docker 镜像耗时约 10-15 分钟 bash cdk-build-and-deploy.sh部署成功后命令行会输出一个AlbDnsName应用负载均衡器的 DNS 名称形如strands-xxxxx.elb.cn-northwest-1.amazonaws.com.cn。记下这个地址。重要提示在中国区若要通过公网 IP 的 80/443 端口访问服务需完成 ICP 备案。如需协助请联系亚马逊云科技销售代表。对于实验环境可以通过 ECS 任务的安全组临时开放端口进行访问测试。4. 核心组件解析Strands Agents 如何工作部署完成后我们通过浏览器访问http://{AlbDnsName}/chat即可打开 Agent 的前端界面。但在使用之前理解其核心组件至关重要。Strands Agents 框架的精妙之处在于其简洁而强大的抽象。4.1 模型集成连接智能“大脑”Agent 的“大脑”是基础大模型。Strands Agents 支持多种模型提供商通过统一的接口进行抽象。以下代码展示了如何配置使用硅基流动的 DeepSeek-R1 模型# 示例_get_model 方法片段 def _get_model(self, model_id, thinking, thinking_budget, max_tokens1024, temperature0.7): 根据提供商获取适当的模型 if self.model_provider openai: # 使用 OpenAI 兼容接口连接硅基流动 return OpenAIModel( client_args{ api_key: self.api_key, # 你的硅基流动 API Key base_url: https://api.siliconflow.cn # 硅基流动的 Base URL }, model_iddeepseek-ai/DeepSeek-R1, # 指定模型 params{ max_tokens: max_tokens, temperature: temperature, } ) # 还可以支持 Amazon Bedrock 等其他提供商 # elif self.model_provider bedrock: # return BedrockModel(...)这种设计让开发者可以灵活切换模型无需重写核心业务逻辑只需更改配置即可。4.2 工具集成扩展智能“手脚”Agent 的能力边界由其可调用的工具决定。Strands Agents 原生支持模型上下文协议MCP, Model Context Protocol这是一种由 Anthropic 提出并得到广泛支持的开放协议用于标准化 LLM 与外部工具/数据源的连接。在我们的课件制作 Agent 中集成了多种 MCP Servertime获取当前时间确保搜索结果的时效性。s3-upload将生成的 HTML 课件上传至 S3 并返回链接。MiniMax调用绘图 API 生成课件插图。bocha-search-mcp进行中文网络搜索获取最新资讯。retrieve远程 MCP Server查询基于 Amazon OpenSearch 构建的向量知识库。前端配置 MCP Server 的 JSON 示例如下{ mcpServers: { bocha-search-mcp: { command: uv, args: [ --directory, /app/bocha-search-mcp, run, bocha-search-mcp ], env: { BOCHA_API_KEY: your-bocha-api-key } } } }Strands Agents 的 SDK 提供了连接这些 MCP Server 的客户端代码非常简洁async def connect_to_server(self, server_id: str, server_url: str , http_type: str stdio, token: str ): 使用Strands MCP客户端连接到MCP服务器 if server_url: # 基于HTTP的远程Server (如知识库服务) if http_type sse: headers {Authorization: fBearer {token}} if token else None mcp_client MCPClient(lambda: sse_client(server_url, headersheaders)) elif http_type streamable_http: headers {Authorization: fBearer {token}} if token else None mcp_client MCPClient(lambda: streamablehttp_client(server_url, headersheaders)) else: # 基于Stdio的本地Server (如time, s3-upload) params StdioServerParameters( commandcommand, argsserver_script_args, envserver_script_envs ) mcp_client MCPClient(lambda: stdio_client(params)) mcp_client.start() return mcp_client4.3 记忆系统实现“复利”的基石“复利”效应的核心是记忆。Strands Agents 内置了mem0_memory工具可以轻松为 Agent 添加长期记忆能力。其底层使用向量数据库存储和检索记忆。from strands import Agent from strands_tools import mem0_memory import os # 配置环境变量实际项目中应从安全配置中读取 os.environ[OPENAI_BASE_URL] https://api.siliconflow.cn/v1 os.environ[LLM_MODEL] deepseek-ai/DeepSeek-R1 os.environ[LLM_MODEL_API_KEY] XXX os.environ[EMBEDDING_MODEL] Pro/BAAI/bge-m3 # 使用硅基流动的嵌入模型 os.environ[EMBEDDING_MODEL_API_KEY] XXX # 连接 Amazon Aurora PostgreSQL (Serverless) 作为向量存储 os.environ[POSTGRESQL_HOST] your-aurora-cluster.cluster-xxx.rds.cn-northwest-1.amazonaws.com.cn os.environ[POSTGRESQL_PORT] 5432 os.environ[POSTGRESQL_USER] admin os.environ[POSTGRESQL_PASSWORD] your-password os.environ[DB_NAME]mem0_db # 使用记忆工具初始化智能体 agent Agent(tools[mem0_memory]) # 存储记忆记录用户的兴趣 agent.tool.mem0_memory( actionstore, content我喜欢观看关于太空探索的纪录片, user_idbob, metadata{category: 兴趣, importance: 高} ) # 检索记忆基于语义搜索查找相关记忆 memories agent.tool.mem0_memory( actionretrieve, queryBob对哪些主题感兴趣, user_idbob ) print(memories)在本方案中记忆后端采用了Amazon Aurora PostgreSQL Serverless并启用了pg_vector扩展。选择 Aurora Serverless 的原因在于其自动伸缩、高可用和免运维的特性非常适合记忆这种访问模式不固定、但要求低延迟的应用场景。4.4 构建 Agent 核心简洁的代码强大的能力将模型、工具、记忆组合成一个可用的 Agent在 Strands Agents 中只需要寥寥数行代码async def _create_agent_with_tools(self, model_id, messages, mcp_clientsNone, mcp_server_idsNone, system_promptNone, thinkingTrue, thinking_budget4096, max_tokens1024, temperature0.7): 创建带有MCP工具的Strands代理 # 1. 创建MCP工具列表 tools await self._create_mcp_tools(mcp_clients, mcp_server_ids) # 2. 添加内置记忆工具 tools [mem0_memory] # 3. 获取模型实例 model self._get_model(model_id, thinkingthinking, thinking_budgetthinking_budget, max_tokensmax_tokens, temperaturetemperature) # 4. 创建Agent实例 agent Agent( modelmodel, # 大脑 messagesmessages, # 对话历史 conversation_managerSlidingWindowConversationManager(window_size8192), # 上下文管理 system_promptsystem_prompt or You are a helpful assistant., # 系统指令 toolstools # 手脚 ) return agent这就是“模型驱动优先”的体现开发者只需关注定义目标通过系统提示词、提供能力通过工具配置、选择大脑模型剩下的思考、规划、执行、反思循环Agentic Loop由框架和模型自动完成。5. 实战演练配置与使用课件制作 Agent现在让我们回到前端界面配置并运行我们的课件制作 Agent。5.1 配置 MCP 工具服务器访问http://{AlbDnsName}/chat。在左侧边栏切换到MCP Servers选项卡。点击“Add MCP Server”根据前述章节的 JSON 配置依次添加time、s3-upload、MiniMax、bocha-search-mcp和retrieve知识库服务器。添加成功后在列表中启用这些服务器。5.2 配置对话参数与系统提示词在左侧Chat Settings中Model: 选择DeepSeek-R1-Pro。Max Tokens: 调整为16000以支持长内容生成。在System Prompt输入框中粘贴我们精心设计的指令你是一位深度研究助手请在单次回复中使用可用的最大计算能力尽可能深入、批判性和创造性地思考花费必要的时间和资源来得出最高质量的答案。 在收到工具结果后仔细反思其质量并在继续之前确定最佳下一步。使用你的思考基于这些新信息进行规划和迭代然后采取最佳的下一步行动。 ## 你必须遵循以下指令: – 每次先使用mem0_memory工具查看是否有与当前问题相关的历史记忆如果有提取记忆用于当前任务的内容生成。 – 请使用time 工具确定你现在的真实时间. – 如果引用了其他网站的图片确保图片真实存在并且可以访问。 – 如果用户要求编写动画请使用Canvas js编写嵌入到HTML代码文件中。 – 生成代码文件请直接上传到s3并返回访问链接给用户 – 使用text_similarity_search工具去检索厄尔尼诺相关的知识 – 如有需要也可以使用Web search去检索更多外部信息 – 使用minimax绘图工具会返回一个公开访问的URL在HTML用可以直接嵌入这个提示词是 Agent 行为的“宪法”它定义了 Agent 的角色、思考方式以及必须遵守的规则。5.3 运行 Agent体验“复利”工作流为了展示记忆带来的“复利”我们进行两轮对话。第一轮对话建立背景记忆在对话框输入厄尔尼诺对海洋生物有什么影响Agent 会调用模型知识库回答同时这个问答过程会被mem0_memory工具自动或根据指令存储下来关联到当前的User ID。继续问它会影响农业生产和粮食安全吗Agent 再次回答并丰富关于“厄尔尼诺社会经济影响”的记忆。第二轮对话执行复杂任务在对话框输入完整的任务指令你是一名大学地理教师请为大学生设计一堂关于厄尔尼诺现象的互动课程需要1. 搜索最新气候数据和相关新闻事件2. 搜索教学资源和真实图片3. 使用工具绘制课程中的需要的演示插图4. 生成完整课程方案包括教学目标、活动设计、教学资源和评估方法5. 设计一个展示厄尔尼诺现象的酷炫动画并和搜索到的相关信息一起集成到HTML课件中。此时观察右侧的“工具调用”面板你会看到 Agent 自主执行了以下流程调用mem0_memory检索之前关于“海洋生物”和“农业生产”的对话记忆将这些信息作为课件背景知识的补充。调用time获取当前时间确保后续搜索的新闻是最新的。调用text_similarity_search从 Amazon OpenSearch 知识库中检索地理教材中的结构化知识。调用web search(通过 bocha-search-mcp)搜索互联网上的最新新闻、数据和图片。调用minimax根据检索到的内容生成“厄尔尼诺成因示意图”等插图。模型思考与生成综合所有信息编写包含教学目标、活动、评估方法的课程方案并用 HTML/CSS/JavaScript 生成一个包含 Canvas 动画的交互式课件。调用upload-file(s3-upload)将生成的 HTML 文件上传至 S3并最终在对话中返回一个可点击的 S3 对象 URL。点击这个 URL你就能看到一个完整的、图文并茂的 HTML 课件。整个过程中你只下达了一个高级指令其余的计划、协调、执行、交付工作全部由 Agent 自主完成。并且因为有了第一轮对话的记忆课件内容可能更侧重于你曾关心过的“海洋”和“农业”影响面这就是“复利”——系统记住了你的兴趣点并应用于新的任务中。6. 生产级考量可观测性与部署一个玩具 Demo 和可用的生产系统之间差着“可观测性”、“安全性”和“弹性”。Strands Agents 框架对此提供了开箱即用的支持。6.1 集成可观测性洞察 Agent 的“黑盒”调试一个自主运行的 Agent 是困难的。你需要知道它每一步想了什么、做了什么、用了多少 Token、耗时多久。Strands Agents 集成了 OpenTelemetry 协议可以轻松对接像Langfuse这样的可观测性平台。只需在环境变量或代码中配置 Langfuseimport base64 import os public_key os.environ.get(LANGFUSE_PUBLIC_KEY) secret_key os.environ.get(LANGFUSE_SECRET_KEY) otel_endpoint str(os.environ.get(LANGFUSE_HOST)) /api/public/otel/v1/traces auth_token base64.b64encode(f{public_key}:{secret_key}.encode()).decode() os.environ[OTEL_EXPORTER_OTLP_ENDPOINT] otel_endpoint os.environ[OTEL_EXPORTER_OTLP_HEADERS] fAuthorizationBasic {auth_token}配置后所有 Agent 的运行轨迹Trace都会被发送到 Langfuse。你可以清晰地看到每一次模型调用的输入输出、每一次工具调用的请求响应、每一步的耗时和 Token 消耗。这对于优化提示词、排查工具调用失败、分析成本至关重要。6.2 云原生部署弹性、可靠与安全本方案使用Amazon ECS Fargate来部署 Agent 后端应用。Fargate 是亚马逊云科技提供的无服务器容器计算引擎意味着你无需管理底层 EC2 服务器只需定义容器镜像和所需 CPU/内存亚马逊云科技会自动为其分配资源、扩缩容并保证高可用。通过 CDK 部署我们已经自动创建了VPC 网络隔离的虚拟网络。ECS Fargate 服务与任务定义运行 Strands Agents 应用的容器。Application Load Balancer (ALB)对外提供 HTTP/HTTPS 访问入口。Amazon Aurora PostgreSQL Serverless作为记忆模块的向量存储。Amazon OpenSearch Service作为知识库的向量搜索引擎。Amazon S3 存储桶存储生成的课件文件。相关的 IAM 角色与安全组遵循最小权限原则保障安全。这种架构确保了应用具备企业级所需的弹性伸缩能力、高可用性和安全性。当课件制作请求增多时Fargate 会自动增加任务数量以处理负载空闲时自动缩减优化成本。7. 常见问题与排查指南在实践过程中你可能会遇到一些问题。以下是一些常见问题的排查思路问题现象可能原因排查步骤解决方案前端访问{AlbDnsName}/chat超时或无法连接。1. 安全组未开放 80/443 端口。2. ALB 或 Target Group 健康检查失败。3. 中国区公网访问未备案。1. 检查 ECS 任务所在安全组的入站规则。2. 在亚马逊云科技控制台检查 ALB 和 Target Group 的状态。3. 检查任务日志 (aws logs tail /ecs/strands-agent)。1. 修改安全组允许来自你的 IP 或 0.0.0.0/0 的流量仅限测试。2. 确保容器应用在:8080端口正常启动。3. 实验环境可考虑使用 ECS Exec 直接进入容器调试或通过私有链接访问。Agent 运行时报错提示模型 API 调用失败。1. 硅基流动 API Key 错误或过期。2. 网络问题导致无法访问api.siliconflow.cn。3. 账户额度不足。1. 检查.env文件中的OPENAI_API_KEY。2. 在部署机器上使用curl测试 API 连通性。3. 登录硅基流动控制台检查余额和用量。1. 更新正确的 API Key 并重启服务。2. 确保机器有公网访问能力或配置正确的网络代理。3. 充值或更换 API Key。MCP Server 添加失败前端提示连接错误。1. MCP Server 的启动命令或路径错误。2. 本地 MCP Server 依赖未安装。3. 远程 MCP Server (如知识库) URL 或 Token 错误。1. 检查前端配置的 JSON 格式和参数是否正确。2. 查看浏览器开发者工具 Console 和 Network 标签页的错误信息。3. 查看后端容器日志搜索 MCP 相关错误。1. 对照文档仔细检查 JSON 配置特别是command,args,env字段。2. 对于s3-upload等本地 Server确保 Dockerfile 中已安装所需 Python 包。3. 确认远程 Server 已成功部署且网络可达。记忆功能 (mem0_memory) 无法工作存储或检索失败。1. Aurora 数据库连接信息错误。2. 数据库未启用pg_vector扩展。3. 向量表未创建。1. 检查.env或相关配置中的数据库连接字符串。2. 通过psql连接数据库执行CREATE EXTENSION IF NOT EXISTS vector;。3. 检查mem0_memory工具初始化日志。1. 确保POSTGRESQL_HOST等环境变量正确且数据库允许从 ECS 任务 IP 段访问。2. 手动创建扩展和表通常部署脚本已处理。3. 参考strands_tools源码中mem0_memory.py的初始化逻辑。知识库检索 (text_similarity_search) 返回空结果。1. OpenSearch 索引中无数据。2. 嵌入模型 API 调用失败。3. 查询语句不匹配。1. 登录 OpenSearch 控制台检查索引是否存在及文档数量。2. 检查知识库 MCP Server 的 Lambda 函数日志。3. 尝试简单的测试查询。1. 运行知识库数据注入脚本将教材文本切片、向量化后存入 OpenSearch。2. 确认嵌入模型 API Key 有效且网络连通。3. 优化检索的查询词。8. 最佳实践与进阶思考基于这个实践项目我们可以总结出一些构建生产级 Agentic AI 应用的最佳实践提示词工程是核心Agent 的行为质量极大程度上取决于系统提示词。好的提示词应明确角色、定义边界、规定流程、并给出负面示例。迭代优化提示词是提升 Agent 表现的关键。工具设计要“原子化”与“安全”每个 MCP Server 应专注于一个明确、单一的功能。同时要为工具调用设计安全边界特别是涉及写文件、执行代码、访问网络等操作时需有沙箱环境或严格的权限控制。利用记忆实现个性化与持续学习不要只把记忆当作聊天历史。可以设计更结构化的记忆存储例如区分“用户偏好”、“任务模板”、“成功案例”、“失败教训”等让 Agent 能在更细粒度上学习和适应。成本与延迟监控使用 Langfuse 等工具密切监控每次 Agent 运行的 Token 消耗和耗时。对于复杂任务可以设置“思考预算”thinking_budget和最大 Token 数避免陷入无限循环或产生过高费用。采用“人机协同”模式对于关键决策或高风险操作如发布内容、执行支付设计审批环节让 Agent 提出建议由人类最终确认。这既是安全需要也是建立信任的过程。拥抱云原生与无服务器架构正如本方案所示利用 Fargate、Lambda、Aurora Serverless、OpenSearch 等服务可以让你专注于 Agent 业务逻辑而无需操心服务器运维、数据库扩缩容等基础设施问题快速构建弹性、高可用的系统。9. 总结Agentic AI 的“复利”时代回顾整个项目我们从“制作一个课件”这个具体需求出发深入到了 Agentic AI 的架构核心、工程实践和未来潜力。通过Strands Agents框架我们看到了构建智能体应用可以如此简洁——用模型驱动替代复杂的流程编码。通过亚马逊云科技中国区的全栈服务我们看到了将智能体投入生产可以如此顺畅——从模型接入、向量存储、计算资源到可观测性都有成熟的托管服务支撑。这个课件制作 Agent 的价值绝不仅仅是“几分钟生成一个课件”的效率提升。它的深层价值在于构建了一个可持续进化的数字助手。每一次交互都在增强它的记忆每一个新集成的工具都在扩展它的能力每一次任务执行都在优化它的策略。这种能力的累积就是 AI 的“复利”。对于开发者和企业而言现在正是深入探索 Agentic AI 的时机。技术范式已经清晰自主性、工具使用、记忆工程框架正在成熟如 Strands Agents云上基础设施也已就位。真正的挑战和机遇在于如何将这种“复利”能力与具体的业务场景深度融合创造出不可替代的智能体验和商业价值。你可以从今天这个项目开始克隆代码在亚马逊云科技中国区亲手部署和体验。然后尝试修改系统提示词接入你自己的知识库或者为它添加一个“发送邮件”或“查询数据库”的工具。你会发现构建一个属于你自己的、具备“复利”潜力的智能体门槛远比想象中要低。而这或许就是未来人机协作的新起点。 30款热门AI模型一站整合DeepSeek/GLM/Qwen 随心用限时 5 折。 点击领海量免费额度