根据周一发布的一份研究报告,据称,斯坦福大学和华盛顿大学的AI研究人员已经完成了没有人想到的事情 - 根据周一发布的一份研究报告,他们建立了一种名为S1的AI模型S1,云计算学分低于50美元。
据报道, S1模型与顶级推理模型(包括OpenAI的O1和DeepSeek的R1)提供了表现。更好的是,整个项目都可以在github上找到 - 编码,数据和所有项目。
团队首先抓住了现成的模型,而不是建造新的东西。从那里,他们通过称为蒸馏的过程对其进行了微调。根据他们的研究,他们从Google的Gemini 2.0 Flash思维实验模型中提炼了推理能力。
他们通过从其答案中学习来训练S1,以模仿双子座的解决问题的技术。斯坦福大学研究人员之一尼克拉斯·穆尼基诺夫(Niklas Muennighoff)说:“我们的目标是简单。”
对于希望降低成本的人工智能团队来说,蒸馏迅速成为首选武器。伯克利研究人员上个月开发的类似AI模型的培训费用为450美元,但按行业标准却是便宜的。但是,斯坦福大学和西澳大学将其进一步迈出了一步,通过使用较小的数据集和简化技术将其模型提炼出来,将成本降至50美元。
研究人员只对1000个问题进行了挑剔,每个问题都与Google的Gemini 2.0的详细答案和逐步推理配对。该数据集提供了高级执行所需的所有知识S1。根据团队的论文,该模型学会了如何通过问题思考。
监督微调或SFT是进行这项工作的关键。研究人员没有使用大量数据集和大量计算能力的增强学习,而是选择了SFT,这种方法是直接对AI进行了直接训练以模拟数据集中发现的行为的方法。它更便宜,更快,在这种情况下,它起作用了。
基本模型来自阿里巴巴拥有的AI实验室Qwen。他们的现成模型可以免费下载,使该项目更加友好。在不到30分钟的时间内,仅使用16个NVIDIA H100 GPU,该团队完成了训练S1。穆尼霍夫说:“我们今天可以租用必要的计算,价格约为20美元。”
据报道,研究人员包括提高S1推理的巧妙技巧:他们在解决问题期间添加了“等待”一词。通过告诉模型暂停并仔细检查其工作,它们提高了准确性。该研究论文详细介绍了这项调整如何给S1足够的时间在提交之前考虑更好的答案。
Openai正在密切关注。他们已经指责DeepSeek从其API中收集数据不当来建立AI竞争对手。 S1显示出廉价的复制能力,诸如Openai之类的大型玩家并不激动。 AI模型的商品化可能会损害他们的底线。
但是科技公司还有其他问题。周二,埃隆·马斯克(Elon Musk)的法律团队在奥克兰联邦法庭上对抗OpenAI。埃隆(Elon)是OpenAI的早期投资者,声称该公司放弃了其非营利性使命,并背叛了其最初的目标。
他正在起诉将他们的过渡到完全营利性的业务。埃隆(Elon)的律师马克·托伯夫(Marc Toberoff)周五对法院表示,埃隆(Elon)在成立和2018年之间向OpenAI投资了4500万美元,因为他认为它始终将公共利益优先于利润而不是利润,就像它一开始时会优先考虑公共利益。
法官伊冯·冈萨雷斯·罗杰斯(Yvonne Gonzalez Rogers)称其为“伸展”,并质疑埃隆(Elon)为什么在没有书面trac的情况下甚至会投资这么多钱。她嘲笑说:“这只是握手上的很多钱。” Toberoff律师随后解释说,Elon和Openai的首席执行官Sam Altman当时有着密切的关系,一切都是基于信任的。
但是案件还没有死。法官担心Openai与Microsoft的密切关系。 Openai的董事会参与了两个关键球员 - Linkedin联合创始人Reid Hoffman和Microsoft执行执行Deanna Templeton。邓普顿(Templeton)在2023年短暂罢免后,被添加为非投票成员,但后来在反托拉斯问题上被删除。
埃隆(Elon)希望通过自己的AI Venture Xai制止他们的计划,并有可能对公司进行更多控制权,他将其作为原告添加。 Openai认为,Elon的要求将使其业务ripple ,并基于“牵强”的主张。
Cryptopolitan Academy:免费 Web3 简历备忘单 -立即下载