开云体育s1模子的考试并非从零开动-开云集团「中国」Kaiyun·官方网站
《科创板日报》2月6日讯 (记者 毛明江 黄心怡) 当天一则对于东说念主工智能限制的新闻激发平素海涵。
据报说念,李飞飞等斯坦福大学和华盛顿大学的计划东说念主员以不到50好意思元的云野心用度,获胜考试出了一个名为s1的东说念主工智能推理模子。该模子在数学和编码材干测试中的确认,据称与OpenAI的O1和DeepSeek的R1等顶端推理模子不相潦倒。
这一音书无疑在AI界投下了一颗重磅炸弹,真相究竟怎么?
《科创板日报》记者探访和采访业内东说念主士后发现,s1模子的考试并非从零开动,而是基于阿里云通义千问(Qwen)模子进行监督微调。这意味着,s1模子的神奇“低本钱”,是诞生在已具备遍及材干的开源基础模子之上。
▍通义模子的“基座”作用
证据李飞飞等东说念主的磋论说文,s1模子的考试仅使用了1000个样本数据。按照业内共鸣,这一数据量在AI考试中可谓蝇头小利,常常不及以考试出一个具备推理材干的模子。
后生AI科学家、上海交通大学东说念主工智能学院谢伟迪副训诫告诉《科创板日报》记者,要是仔细计划斯坦福s1的论文会发现,s1模子的神奇是以通义千问模子为基座进行微调,这1000个样本考试的作用更像是“精雕细镂”,而非“从零开动”。
国内某著名大模子公司CEO也向《科创板日报》记者暗意:“从论文原文来看,所谓用50好意思元考试出新的具有推理材干的模子,执行上仅仅用从谷歌模子中索要出来的1000个样本,然后对通义千问模子进行监督微调。这种微调的本钱照实很低,但昭彰是站在既有最初模子的‘肩上’材干作念到。”
###斯坦福s1论文原文也注明模子是以阿里通义千问模子为基础微调
谢伟迪指出,国表里还有其他团队也宣称用极低的本钱,考试出了具有推理材干的新模子。但一阅读其论文原文,就会发现它们无一例外齐是基于通义模子行为基座进行的。
###国际多位东说念主工智能计划者也指出,不少的“新”模子齐是诞生通义模子基础上
“以通义千问模子行为基座,照实不错用很少的样本数据就达到产生新的推理模子的成果,但要是换成其他基座模子,新模子材干却莫得任何的提高。是以,材干确凿神奇的是Qwen模子,而不是s1。 ” 谢伟迪说。
▍低本钱考试大模子有局限,但亦然处所
尽管s1模子的低本钱考试在某种进度上展示了AI考试的后劲,但其局限性也艰难刻薄。
发轫,这种低本钱考试依赖于已有的遍及基座模子,如阿里通义千问模子。要是莫得这么的基座模子,低本钱考试的成果将大打扣头。
其次,1000个样本数据的考试量在大多半情况下是不够的,尤其是在需要处理复杂任务的场景中。
此外,低本钱考试的获胜也激发了对AI模子常识产权和伦理问题的磋议。要是越来越多的计划依赖于已有的基座模子进行微调,那么这些基座模子的诱惑者是否应该得回相应的薪金?怎么确保AI技能的刚正使用和分享?这些问题齐需要业界进一步探讨和措置。
尽管s1模子的低本钱考试激发了争议,但其背后的计划念念路无疑为AI限制提供了新的念念考处所。
武汉东说念主工智能学院一位资深计划东说念主员向《科创板日报》记者暗意开云体育,如安在保证模子性能的前提下,镌汰考试本钱,是AI计划的一个进攻课题。异日,跟着技能的跳动和算法的优化,好像咱们真实能够看到更多低本钱、高性能的AI模子问世。