
510亿融资后DeepSeek的新征程6月29日晚DeepSeek宣布V4正式版将于7月中旬正式上线。公告中说明为合理配置资源、提升服务稳定性正式版发布后将同步调整API定价策略引入峰谷定价机制。过去两周DeepSeek还有两件大事一是6月16日完成成立以来首轮外部融资募资总额510亿元估值将近4000亿元打破创始人梁文锋“不融资、不上市、不商业化”的原则二是融资后仅十几天6月27日DeepSeek团队联合北京大学发布论文《DSpark: Confidence - Scheduled Speculative Decoding with Semi - Autoregressive Generation》创始人梁文锋位列作者名单。如果说上半场DeepSeek要证明能做出世界一流大模型那么下半场“资本”和“技术”相汇它要向世界证明是真正的商业公司。500亿之后DeepSeek开始补人融资以来DeepSeek Harness团队新负责人崔添翼没闲着。6月25日晚DeepSeek在社交平台发布大规模招聘信息覆盖算法、研发、运维、产品、数据工程师及职能部门等7大类、共33个岗位工作地点包括北京和杭州所有岗位均接受实习。在DeepSeek官网官号、Boss直聘、X和小红书等平台能看到这位梁文锋的浙大校友、今年3月加入团队的负责人下场招人还抽空“辟谣”。此前DeepSeek像沉默、低调的技术员背靠梁文锋创办的量化私募基金“幻方量化”幻方量化2025年年化收益率56.55%管理规模超700亿元让DeepSeek不依赖外部资本外界觉得它“并不缺钱”。梁文锋改变融资态度可能是核心人才流失和外部抢人大战加速。参照系中已上市的“大模型第一股”智谱截至6月30日总市值近万亿港元MiniMax市值超1300亿港元。而DeepSeek员工期权是白纸公司不融资、不上市、无外部估值参考。一位接近DeepSeek的资深从业者表示“不融资估值不涨员工期权也不涨相比其他大模型团队DeepSeek员工留不住”。留住人才成本不小。2025年DeepSeek优势是百余人的高学历“天才”团队几十位顶尖研究员和创始人梁文锋创造出DeepSeek - R1。今年互联网大厂高薪“挖”顶级AI研究员市场对AI人才需求激增公开数据显示算法岗位月薪中位数超2.4万元头部人才月薪超5万元AI人才溢价扩大。此次大规模招聘岗位中HR、法务、财务、采购、行政等职能部门也扩招。全方位“扩编”表明DeepSeek在补齐科技公司组织能力。从“产品驱动”迈向“组织驱动”是科技公司必经之路组织成熟、平台完善、人才激励机制建立后产品红利才释放。完成500亿融资既为留人也为补全组织架构但DeepSeek扩招后能否保持“小团队作战”的精简高效和决策链灵活敏捷这是“下半场”要回答的第一个问题。DeepSeek走向重资产6月25日发布的33个招聘岗位中IDCInternet Data Center互联网数据中心数据中心团队岗位值得关注涉及基础设施建设。早在4月中旬DeepSeek就在内蒙古乌兰察布发布首批数据中心岗位包括数据中心高级运维工程师和数据中心高级交付经理6月又新增“IDC设计规划工程师”岗位。今年以来DeepSeek人才布局从模型延伸至算力基础设施建设。大模型进入规模化训练和推理阶段AI模型公司竞争进入“基础设施”硬件竞赛这使DeepSeek像硅谷前沿头部大模型公司一样加入自建算力集群的重资产“烧钱”游戏。公开数据显示美国科技巨头Alphabet、亚马逊、Meta和微软预计今年投资约6500亿美元扩大人工智能相关基础设施。Anthropic、OpenAI也强调持续加大算力基础设施投入如Anthropic预计仅数据中心容量租赁每月向SpaceX支付约12.5亿美元一年150亿美元还不包括GPU采购、网络、运维等。工信部信息通信经济专家委员会委员盘和林指出当前AI投资热潮下大模型企业融资是大势所趋“不仅DeepSeek谷歌也融资800亿美元行业进入重资本阶段”。为不在算力重资本建设上掉队DeepSeek需“开源”资金投入算力、数据中心等基础设施建设。值得注意的是DeepSeek在海外先进算力出口受限情况下建设算力基础设施意味着算力由国产芯片驱动V4发布时DeepSeek就在官方页面和技术报告里提到国产算力探索。5月底华为提出“韬τ定律”试图突破摩尔定律放缓瓶颈国产大模型加速适配国产算力目标是“自主可控的AI基础设施”。AGI的前夜对于DeepSeek这样的基础模型公司仅有资本和组织不足以长期领先关键是持续产出原创技术。一位资深算力从业者强调DeepSeek本轮大规模融资是为激励团队、留下核心人才“只有足够融资才能训出好模型奠定头部位置”。论文是DeepSeek新技术探索的缩影。近两年DeepSeek公开发表约27篇核心技术论文研究方向覆盖MoE混合专家、强化学习、代码大模型、数学推理、多模态等对应每一代核心模型和关键技术突破。6月27日DeepSeek官方在GitHub上更新一篇与“DSpark”新技术有关的论文。论文中DeepSeek提出全新推理加速框架“DSpark”不改变模型能力大幅提升大模型推理速度和系统吞吐。与此前不同这篇论文没迭代新模型而是在原有DeepSeek - V4 - Pro和DeepSeek - V4 - Flash基础上增加推测解码模块重点在工程落地层面优化。DeepSeek意图将DSpark部署在DeepSeek - V4线上服务系统、承接真实用户流量时减少无效校验带来的算力浪费。论文提及“不改变底层模型架构生成速度提高60 - 85%”。对于处理海量API请求的AI公司算力成本降低利润空间增加。据VentureBeat消息模型训练费用会越来越高Anthropic的CEO Dario Amodei预测未来一代前沿模型培训成本达50亿至100亿美元。上述资深算力从业者表示DeepSeek也将进入“烧钱”训练模型阶段。为支持模型训练迭代融资是必然。更多媒体解读融资后十几天上线新论文DeepSeek似乎证明核心节奏未变研发团队保持高频输出。不论是上新模型、建设数据中心还是从“天才实验室”转变为商业化运营的AI公司DeepSeek进化尽头是AGI。2024年梁文锋明确表态“我们做的就是AGI通用人工智能语言大模型可能是通往AGI的必经之路。”免费阶段用户能容忍响应失败、对话中断、API限流等问题。7月DeepSeek V4正式版上线后用户对稳定性要求提高问题若持续存在将影响用户是否将DeepSeek接入工作流和业务系统。来到付费端、开发者生态和企业场景DeepSeek工程能力将面临更严格考验模型能否大规模应用是进入AGI时代的门槛。用户希望DeepSeek推动中国大模型降本增效它却要留住人、持续训练模型、技术迭代数据中心基础设施建设也不能输。光靠梁文锋的幻方量化不够2026年DeepSeek启动融资是必然选择。正如6月25日晚招聘公告所说“当今人类正处于AGI的前夜。”下一步DeepSeek要面对更长期、更烧钱的AGI竞赛。能否像在“大模型”竞赛中出圈一样在AGI进程中“领跑”这是DeepSeek“下半场”要回答的第二个问题。