智源大会落幕,200+AI大佬达成了哪些共识? 6月12日第八届北京智源大会开幕。中关村国际创新中心两天时间200多位全球顶尖AI专家——图灵奖得主、Meta和英伟达的科学家、清华北大教授、阿里腾讯的AI负责人——全到齐了。过道都站满了人。他们讨论的核心问题只有一个AI的下一步往哪走两天下来三个共识反复出现在每一场演讲、每一轮圆桌、每一次私下交流里。共识一Agent会比你想象的更早接管你的工作流如果你还在用先打开ChatGPT、再复制结果、再粘贴到另一个工具里的流程这个流程最多再活半年。本届大会最密集出现的关键词不是大模型而是Agent——能自主规划、调用工具、分步骤完成复杂任务的智能体。一个简单的例子被反复提及你给Agent一个任务帮我做一份本月的竞品分析报告它自己去搜资料、调数据分析、写PPT大纲、排版、发邮件给你审核——不用你分步操作全程自动。这背后是靠什么不是靠一个模型。搜索用搜索引擎API数据分析跑代码执行环境写文案调大语言模型排版调文档工具链——一个Agent在执行一个任务的过程中最少要调用3到5个不同模型或工具。Meta首席AI科学家杨立昆在大会上说得更直白未来的AI系统不是一个大黑箱而是一个调度系统——知道在什么时间、用什么工具、解决什么问题。多模型API切换就是这个调度系统的底层能力。不是可选功能是刚需。共识二世界模型——AI必须走出对话框本届大会由智源研究院院长王仲远定调AI正从大语言模型走向世界模型。大语言模型擅长的是文字描述世界。你说杯子掉在地上会碎它能告诉你为什么。但你让它预测一个真实世界中正在坠落的杯子下一秒会发生什么——它做不到。这并不是概念的升级这是能力的维度跨越。智源把世界模型分成了四条技术路线以语言为中心、以像素为中心、以三维结构为中心、以视觉表征为中心。每条路线都有代表团队也各有局限。目前还没有一条路能跑通但资金已经疯狂涌入——过去18个月全球超过100亿美元砸进了世界模型和机器人AI方向。具身智能是确定性最高的落地场景。智源发布了悟界·RoboBrain Orca——一个让机器人理解物理世界、自主完成任务的具身大脑。物流、酒店、工厂巡检真实场景已经在跑了。但这里有一个关键问题——一台机器人需要同时跑视觉识别、路径规划、任务决策、对话交互四类模型没有一个是同一个厂家提供的。视觉模型可能是智源自研的路径规划跑英伟达任务决策用DeepSeek对话用通义千问。四个模型串成一条工作流只要中间一个接口崩了机器人就是一堆废铁。所以具身智能大规模落地的第一步不是模型算法突破是AI模型统一接口这件事先跑通。共识三差距不在参数在调用效率国内超过60个大模型通过备案全球可调用的超过200个。谁能做出最强模型的时代交卷了。下一题是谁能把200个模型调度得最合理。写代码找DeepSeek长文档丢Kimi产品视频Seedance最能打——每个任务选对的模型。这事需要一个中间层大模型API聚合平台200模型API接入统一成一个入口。模型再怎么升级迭代——接口不变、Token逻辑不变。王仲远闭幕时说从卷参数转向卷调用。统一的接口后面器灵模型在不断替你选最优解。可以去试试看调用效率是不是真的那么高