<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml>
<head> 
<meta http-equiv="Expires" content="0"/> 
<meta http-equiv="Cache-Control" content="no-cache"/> 
<meta http-equiv="Pragma" content="no-cache"/> 
</head>
<card title="李飞飞团队50美元复现DeepSeek R1？ 真相来了_砍柴网">
	<p><a href="https://wap.ikanchai.com/">首页</a> &gt; <a href="https://wap.ikanchai.com/?action=category&amp;catid=5">科技快报</a> &gt; <a href="https://wap.ikanchai.com/?action=category&amp;catid=16">业界</a> &gt; </p>
	<p align="center"><big>李飞飞团队50美元复现DeepSeek R1？ 真相来了</big></p>
	<p align="right">2025-02-07 09:28</p>
	<p>2月6日讯&nbsp; 今日一则关于人工智能领域的新闻引发广泛关注。<br />
据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。<br />
这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？<br />
《科创板日报》记者调查和采访业内人士后发现，s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。这意味着，s1模型的神奇&ldquo;低成本&rdquo;，是建立在已具备强大能力的开源基础模型之上。<br />
▍通义模型的&ldquo;基座&rdquo;作用<br />
根据李飞飞等人的研究论文，s1模型的训练仅使用了1000个样本数据。按照业内共识，这一数据量在AI训练中可谓微乎其微，通常不足以训练出一个具备推理能力的模型。<br />
青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者，如果仔细研究斯坦福s1的论文会发现，s1模型的神奇是以通义千问模型为基座进行微调，这1000个样本训练的作用更像是&ldquo;锦上添花&rdquo;，而非&ldquo;从零开始&rdquo;。<br />
国内某知名大模型公司CEO也向《科创板日报》记者表示：&ldquo;从论文原文来看，所谓用50美元训练出新的具有推理能力的模型，实际上只是用从谷歌模型中提炼出来的1000个样本，然后对通义千问模型进行监督微调。这种微调的成本确实很低，但明显是站在既有领先模型的&lsquo;肩上&rsquo;才能做到。&rdquo;<br />
<p align="center"><img src="https://d.ifengimg.com/w843_h792_q90_webp/x0.ifengimg.com/ucms/2025_06/6FDC02AD9BE71BAA1834D22A0D34F98427A99920_size227_w843_h792.png" border="0" data-lazyload="https://x0.ifengimg.com/ucms/2025_06/6FDC02AD9BE71BAA1834D22A0D34F98427A99920_size227_w843_h792.png" /></p><br />
斯坦福s1论文原文也注明模型是以阿里通义千问模型为基础微调<br />
谢伟迪指出，国内外还有其他团队也声称用极低的成本，训练出了具有推理能力的新模型。但一阅读其论文原文，就会发现它们无一例外都是基于通义模型作为基座进行的。<br />
<p align="center"><img src="https://d.ifengimg.com/w1125_ablur_q90_webp/x0.ifengimg.com/ucms/2025_06/D0FB2272782FD35541DA7CA1A711893CA4783C95_size530_w1200_h1576.png" border="0" data-lazyload="https://x0.ifengimg.com/ucms/2025_06/D0FB2272782FD35541DA7CA1A711893CA4783C95_size530_w1200_h1576.png" /></p><br />
国外多位人工智能研究者也指出，不少的&ldquo;新&rdquo;模型都是建立通义模型基础上<br />
&ldquo;以通义千问模型作为基座，确实可以用很少的样本数据就达到产生新的推理模型的效果，但如果换成其他基座模型，新模型能力却没有任何的提升。所以，能力真正神奇的是Qwen模型，而不是s1。 &rdquo; 谢伟迪说。<br />
▍低成本训练大模型有局限，但也是方向<br />
尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力，但其局限性也不容忽视。<br />
首先，这种低成本训练依赖于已有的强大基座模型，如阿里通义千问模型。如果没有这样的基座模型，低成本训练的效果将大打折扣。<br />
其次，1000个样本数据的训练量在大多数情况下是不够的，尤其是在需要处理复杂任务的场景中。<br />
此外，低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调，那么这些基座模型的开发者是否应该获得相应的回报？如何确保AI技术的公平使用和共享？这些问题都需要业界进一步探讨和解决。<br />
尽管s1模型的低成本训练引发了争议，但其背后的研究思路无疑为AI领域提供了新的思考方向。<br />
武汉人工智能学院一位资深研究人员向《科创板日报》记者表示，如何在保证模型性能的前提下，降低训练成本，是AI研究的一个重要课题。未来，随着技术的进步和算法的优化，或许我们真的能够看到更多低成本、高性能的AI模型问世。<br />
【来源：财联社】<br /></p>
		<p><a href="https://wap.ikanchai.com/?action=comment&amp;contentid=615439">共有评论0条</a></p>
	<p>
	<p>相关推荐</p>
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=652811">用DeepSeek两小时写首歌爆火：程序员直接入账20万</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=651565">国产万亿参数大模型再次爆发 但还不是DeepSeek V4</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=648532">DeepSeek新模型曝光：MODEL1代码预示新架构，最快有望2月发布</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=648363">DeepSeek震惊硅谷将满一周年 金融时报：中国将赢得AI竞争</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=646388">QuestMobile：豆包、DeepSeek、元宝周活跃用户位居前三</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=645813">小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSeek快</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=645488">英伟达否认“DeepSeek 使用禁售Blackwell 芯片”相关传闻</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=642821">“雷军千万年薪要挖”的DeepSeek罗福莉官宣加入小米大模型团队</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=642722">李飞飞发长文畅谈“空间智能”：实现机器真正智能的关键突破</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=640650">DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=640393">豆包逆袭DeepSeek 连线：字节跳动如何打造中国最火AI聊天机器人？</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=638182">DeepSeek声明：防范冒用“深度求索”名义实施诈骗</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=627600">一天内完成更新！腾讯元宝、QQ浏览器等接入DeepSeek R1最新版</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=626082">OPPO发布首台“直播手机”，深度整合DeepSeek</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=623083">时隔3个月再访北京 曝黄仁勋会见DeepSeek创始人梁文锋</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=622799">DeepSeek独占鳌头！中国AI原生App月活突破2.4亿：豆包、元宝紧随</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=622731">中国AI原生App月活突破2.4亿：DeepSeek居榜首，豆包、腾讯元宝紧随其后</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=621703">全国首个，深圳海关智能查验机器人引入“满血版”DeepSeek-R1</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=621437">DeepSeek首次用于地震国际救援：7小时攻克缅甸救灾语言关</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=620596">美媒：DeepSeek激活中国科技业 OpenAI、英伟达或付出代价</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=620507">迎头挑战还是换赛道？英媒：DeepSeek让所有同行陷入抉择</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=619788">感谢DeepSeek：Predibase发布全球首个端到端强化微调平台并开源</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=619350">受DeepSeek-R1启发，小米大模型团队登顶音频推理MMAU榜</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=618723">行业首例：亚马逊云科技宣布上线DeepSeek-R1全托管服务</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=618598">董明珠：将基于DeepSeek等打造格力智能家居垂类大模型</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=618590">富士康开发出台湾首个推理大模型 性能落后于DeepSeek</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=618518">北京大学联合华为发布全栈开源DeepSeek推理方案</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617871">阿里万相大模型，反超DeepSeek-R1！</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617611">DeepSeek开源周第五天：“动力推进器”Fire-Flyer文件系统</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617602">OpenAI“最大最贵”大模型GPT-4.5，价格是DeepSeek的300倍</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617601">智联招聘“AI招聘助手”Deepseek-R1版上线</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617533">DeepSeek开源第四弹“教”优化，梁文锋参与研发</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617464">英伟达第四财季电话会议：DeepSeek点燃全球热情Blackwell需求惊人</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617371">酷派完成 DeepSeek 满血版融合，即将 OTA 推送升级</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617341">消息称字节跳动AI视频生成产品“即梦”考虑接入DeepSeek</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617178">黄仁勋笑了！DeepSeek爆火最大受益者是英伟达：特供H20芯片在中国订单大增</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617175">波士顿动力创始人：已购买宇树机器人，DeepSeek创新只是个开始</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617165">DeepSeek开源周第二日：开源DeepEP通信库</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617080">YY语音公司接入DeepSeek上线“YYDS”</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617077">DeepSeek接入WPS，输入提示词可一键生成PPT</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617076">DeepSeek启动开源周 FlashMLA代码库发布</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617034">小米超级小爱重新接入DeepSeek R1大模型：已上线</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=617015">DeepSeek超越150万模型：成全球最受欢迎开源大模型</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616914">理想汽车：理想碳化硅电驱工厂早就接入DeepSeek了</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616913">DeepSeek将于下周开源5个代码库 每日解锁新内容</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616548">李彦宏回应文心大模型4.5开源：DeepSeek让我们明白要将最优秀模型开源</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616537">腾讯有自己的大模型，微信为何还要接入DeepSeek？</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616431">阿里云宣布DataWorks正式接入DeepSeek</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616408">AI搜索时代来了！百度搜索接入DeepSeek正式上线</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616352">微信测试接入DeepSeek 腾讯股价暴增3000亿元</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616315">DeepSeek服务器“裸奔”互联网现漏洞 专家提醒：立即修改配置</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616313">DeepSeek等秒变操控电脑AI智能体，微软开源工具OmniParser V2.0发布</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616124">与DeepSeek“深度情感交流”，网易《逆水寒》手游智能NPC“沈秋索”即将上线</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=616084">“日本AI研究第一人”松尾丰评DeepSeek</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615963">腾讯云：支持开发者将DeepSeek接入微信小程序，可实现智能对话、文本生成等</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615958">美媒：DeepSeek或将打破印度在科技领域最后的骄傲</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615928">国家超算互联网平台宣布免费开放3个月DeepSeek API接口</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615867">DeepSeek获马克龙力捧：法国不会采用美国做法，它非常让人尊敬</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615853"> IBM企业级AI开发平台watsonx.ai线DeepSeek R1蒸馏模型</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615841">百度文小言（原文心一言）App接入DeepSeek-R1模型</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615773">DeepSeek日活站上3000万 掀起A股相关科技股涨停潮</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615726">DeepSeek进军中东，与石油巨头沙特阿美联手运营数据中心</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615724">美媒：DeepSeek使投资者重新评估中国科技巨头</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615714">与DeepSeek深度融合后，吉利汽车将于3月初发布AI智能化战略</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615460">亚马逊CEO：DeepSeek降低AI推理成本，但会推动企业在技术上投入更多</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615453">奇安信：仿冒DeepSeek网站已超两千个，六成IP在美国</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615438">DeepSeek梁文锋知乎发言账号确认假冒：已封禁</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615434">研究机构：DeepSeek1月底的在美访问量超越了谷歌Gemini</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615346">复工首日DeepSeek婉拒所有采访，有人已蹲守5次、日韩媒体来得最多</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615344">“非常棒”，又有两家科技巨头点赞DeepSeek</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615342">彭博：下个颠覆人工智能的“DeepSeek”还将来自中国，会是谁？</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615314">担忧数据安全 印度财政部对DeepSeek、ChatGPT出手</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615305">DeepSeek进入“国家队”，超算互联网上线R1/V3/Coder等系列模型</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=615260">AMD：已将DeepSeek模型集成到GPU 针对Al推理进行优化</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=611595">消息称雷军重金招募大模型领军人才，DeepSeek 罗福莉将加入小米</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=274465">斯坦福大学成立以人为本AI研究院 李飞飞任院长</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=250395">李飞飞离职谷歌背后：AI还很稚嫩 作为科学家很卑微</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=243065">李飞飞新动向：担任斯坦福以人为本AI研究院院长</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=234988">李飞飞转任谷歌云顾问 工作重心将重新转回学术界</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=221476">谷歌首席AI科学家李飞飞或离职 重返斯坦福大学AI实验室</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=184935">谷歌李飞飞: AI可能会认识3000种车, 却难理解场景</a><br />
		</p>
<p><anchor title="返回"><prev/>&lt;返回</anchor><br /><br /><a href="https://wap.ikanchai.com/" title="返回首页">&lt;返回首页</a></p>
<p align="center">Copyright CmsTop.com<br />2026年04月14日 23:23:15</p></card>
</wml>