开云体育s1模子的考试并非从零开动-开云集团「中国」Kaiyun·官方网站

发布日期：2025-03-27 06:48 点击次数：93

《科创板日报》2月6日讯（记者毛明江黄心怡）当天一则对于东说念主工智能限制的新闻激发平素海涵。

据报说念，李飞飞等斯坦福大学和华盛顿大学的计划东说念主员以不到50好意思元的云野心用度，获胜考试出了一个名为s1的东说念主工智能推理模子。该模子在数学和编码材干测试中的确认，据称与OpenAI的O1和DeepSeek的R1等顶端推理模子不相潦倒。

这一音书无疑在AI界投下了一颗重磅炸弹，真相究竟怎么？

《科创板日报》记者探访和采访业内东说念主士后发现，s1模子的考试并非从零开动，而是基于阿里云通义千问（Qwen）模子进行监督微调。这意味着，s1模子的神奇“低本钱”，是诞生在已具备遍及材干的开源基础模子之上。

▍通义模子的“基座”作用

证据李飞飞等东说念主的磋论说文，s1模子的考试仅使用了1000个样本数据。按照业内共鸣，这一数据量在AI考试中可谓蝇头小利，常常不及以考试出一个具备推理材干的模子。

后生AI科学家、上海交通大学东说念主工智能学院谢伟迪副训诫告诉《科创板日报》记者，要是仔细计划斯坦福s1的论文会发现，s1模子的神奇是以通义千问模子为基座进行微调，这1000个样本考试的作用更像是“精雕细镂”，而非“从零开动”。

国内某著名大模子公司CEO也向《科创板日报》记者暗意：“从论文原文来看，所谓用50好意思元考试出新的具有推理材干的模子，执行上仅仅用从谷歌模子中索要出来的1000个样本，然后对通义千问模子进行监督微调。这种微调的本钱照实很低，但昭彰是站在既有最初模子的‘肩上’材干作念到。”

###斯坦福s1论文原文也注明模子是以阿里通义千问模子为基础微调

谢伟迪指出，国表里还有其他团队也宣称用极低的本钱，考试出了具有推理材干的新模子。但一阅读其论文原文，就会发现它们无一例外齐是基于通义模子行为基座进行的。

###国际多位东说念主工智能计划者也指出，不少的“新”模子齐是诞生通义模子基础上

“以通义千问模子行为基座，照实不错用很少的样本数据就达到产生新的推理模子的成果，但要是换成其他基座模子，新模子材干却莫得任何的提高。是以，材干确凿神奇的是Qwen模子，而不是s1。 ” 谢伟迪说。

▍低本钱考试大模子有局限，但亦然处所

尽管s1模子的低本钱考试在某种进度上展示了AI考试的后劲，但其局限性也艰难刻薄。

发轫，这种低本钱考试依赖于已有的遍及基座模子，如阿里通义千问模子。要是莫得这么的基座模子，低本钱考试的成果将大打扣头。

其次，1000个样本数据的考试量在大多半情况下是不够的，尤其是在需要处理复杂任务的场景中。

此外，低本钱考试的获胜也激发了对AI模子常识产权和伦理问题的磋议。要是越来越多的计划依赖于已有的基座模子进行微调，那么这些基座模子的诱惑者是否应该得回相应的薪金？怎么确保AI技能的刚正使用和分享？这些问题齐需要业界进一步探讨和措置。

尽管s1模子的低本钱考试激发了争议，但其背后的计划念念路无疑为AI限制提供了新的念念考处所。

武汉东说念主工智能学院一位资深计划东说念主员向《科创板日报》记者暗意开云体育，如安在保证模子性能的前提下，镌汰考试本钱，是AI计划的一个进攻课题。异日，跟着技能的跳动和算法的优化，好像咱们真实能够看到更多低本钱、高性能的AI模子问世。

开云体育s1模子的考试并非从零开动-开云集团「中国」Kaiyun·官方网站

热点资讯

相关资讯