斯坦福大学和大学研究人员建造$ 50开源Chatgpt O1竞争对手

来源 Cryptopolitan

根据周一发布的一份研究报告,据称,斯坦福大学和华盛顿大学的AI研究人员已经完成了没有人想到的事情 - 根据周一发布的一份研究报告,他们建立了一种名为S1的AI模型S1,云计算学分低于50美元。

据报道, S1模型与顶级推理模型(包括OpenAI的O1和DeepSeek的R1)提供了表现。更好的是,整个项目都可以在github上找到 - 编码,数据和所有项目。

团队首先抓住了现成的模型,而不是建造新的东西。从那里,他们通过称为蒸馏的过程对其进行了微调。根据他们的研究,他们从Google的Gemini 2.0 Flash思维实验模型中提炼了推理能力。

他们通过从其答案中学习来训练S1,以模仿双子座的解决问题的技术。斯坦福大学研究人员之一尼克拉斯·穆尼基诺夫(Niklas Muennighoff)说:“我们的目标是简单。”

小数据集,很大的结果

对于希望降低成本的人工智能团队来说,蒸馏迅速成为首选武器。伯克利研究人员上个月开发的类似AI模型的培训费用为450美元,但按行业标准却是便宜的。但是,斯坦福大学和西澳大学将其进一步迈出了一步,通过使用较小的数据集和简化技术将其模型提炼出来,将成本降至50美元。

研究人员只对1000个问题进行了挑剔,每个问题都与Google的Gemini 2.0的详细答案和逐步推理配对。该数据集提供了高级执行所需的所有知识S1。根据团队的论文,该模型学会了如何通过问题思考。

监督微调或SFT是进行这项工作的关键。研究人员没有使用大量数据集和大量计算能力的增强学习,而是选择了SFT,这种方法是直接对AI进行了直接训练以模拟数据集中发现的行为的方法。它更便宜,更快,在这种情况下,它起作用了。

基本模型来自阿里巴巴拥有的AI实验室Qwen。他们的现成模型可以免费下载,使该项目更加友好。在不到30分钟的时间内,仅使用16个NVIDIA H100 GPU,该团队完成了训练S1。穆尼霍夫说:“我们今天可以租用必要的计算,价格约为20美元。”

“等待”命令提高了S1的准确性

据报道,研究人员包括提高S1推理的巧妙技巧:他们在解决问题期间添加了“等待”一词。通过告诉模型暂停并仔细检查其工作,它们提高了准确性。该研究论文详细介绍了这项调整如何给S1足够的时间在提交之前考虑更好的答案。

Openai正在密切关注。他们已经指责DeepSeek从其API中收集数据不当来建立AI竞争对手。 S1显示出廉价的复制能力,诸如Openai之类的大型玩家并不激动。 AI模型的商品化可能会损害他们的底线。

但是科技公司还有其他问题。周二,埃隆·马斯克(Elon Musk)的法律团队在奥克兰联邦法庭上对抗OpenAI。埃隆(Elon)是OpenAI的早期投资者,声称该公司放弃了其非营利性使命,并背叛了其最初的目标。

他正在起诉将他们的过渡到完全营利性的业务。埃隆(Elon)的律师马克·托伯夫(Marc Toberoff)周五对法院表示,埃隆(Elon)在成立和2018年之间向OpenAI投资了4500万美元,因为他认为它始终将公共利益优先于利润而不是利润,就像它一开始时会优先考虑公共利益。

法官伊冯·冈萨雷斯·罗杰斯(Yvonne Gonzalez Rogers)称其为“伸展”,并质疑埃隆(Elon)为什么在没有书面trac的情况下甚至会投资这么多钱。她嘲笑说:“这只是握手上的很多钱。” Toberoff律师随后解释说,Elon和Openai的首席执行官Sam Altman当时有着密切的关系,一切都是基于信任的。

但是案件还没有死。法官担心Openai与Microsoft的密切关系。 Openai的董事会参与了两个关键球员 - Linkedin联合创始人Reid Hoffman和Microsoft执行执行Deanna Templeton。邓普顿(Templeton)在2023年短暂罢免后,被添加为非投票成员,但后来在反托拉斯问题上被删除。

埃隆(Elon)希望通过自己的AI Venture Xai制止他们的计划,并有可能对公司进行更多控制权,他将其作为原告添加。 Openai认为,Elon的要求将使其业务ripple ,并基于“牵强”的主张。

Cryptopolitan Academy:免费 Web3 简历备忘单 -立即下载

免责声明:仅供参考。 过去的表现并不预示未来的结果。
placeholder
黄金小幅上涨,特朗普对欧盟关税提出挑战黄金价格(黄金/美元)在美国(US)消费者物价指数(CPI)数据周三低于预期后,重新走向历史新高,这在美国市场引发了一阵松口气,衰退或滞涨的可能性有所降低
作者  FXStreet
7 小时前
黄金价格(黄金/美元)在美国(US)消费者物价指数(CPI)数据周三低于预期后,重新走向历史新高,这在美国市场引发了一阵松口气,衰退或滞涨的可能性有所降低
placeholder
【今日市场前瞻】黄金三连涨!美国重磅数据将出炉 黄金三连涨,分析师称有望再创新高;美国重磅数据来袭,关注PPI数据和当周初请失业金人数;美元指数反弹>>
作者  Alison Ho
7 小时前
黄金三连涨,分析师称有望再创新高;美国重磅数据来袭,关注PPI数据和当周初请失业金人数;美元指数反弹>>
placeholder
黄金大多头来了!知名投行:第三季度金价可能飙升至3500美元24K99讯 美国彭博社周四(3月13日)最新报道称,知名投行麦格理集团(Macquarie Group)的分析师表示,黄金的避险吸引力不断增强,可能使其价格在第三季度飙升至3500美元/的历史新高。
作者  FX168
8 小时前
24K99讯 美国彭博社周四(3月13日)最新报道称,知名投行麦格理集团(Macquarie Group)的分析师表示,黄金的避险吸引力不断增强,可能使其价格在第三季度飙升至3500美元/的历史新高。
placeholder
今晚美股重磅数据来袭!关注 PPI 数据和当周初请失业金人数北京时间今晚 8:30,美国将公布两项重磅经济数据:截至 3 月 9 日当周初请失业金人数和 2 月生产者价格指数(PPI)。
作者  FXStreet
8 小时前
北京时间今晚 8:30,美国将公布两项重磅经济数据:截至 3 月 9 日当周初请失业金人数和 2 月生产者价格指数(PPI)。
placeholder
黄金技术面释放重大看涨信号!FXStreet高级分析师:金价下一目标挑战历史高位#黄金技术分析#24K99讯 周四(3月13日)欧市早盘,现货黄金维持日内上涨走势,目前金价位于2942美元/盎司附近。FXStreet高级分析师Dhwani Mehta撰文,对金价技术走势进行分析。
作者  FX168
8 小时前
#黄金技术分析#24K99讯 周四(3月13日)欧市早盘,现货黄金维持日内上涨走势,目前金价位于2942美元/盎司附近。FXStreet高级分析师Dhwani Mehta撰文,对金价技术走势进行分析。
goTop
quote