斯坦福大学和大学研究人员建造$ 50开源Chatgpt O1竞争对手

来源 Cryptopolitan

根据周一发布的一份研究报告,据称,斯坦福大学和华盛顿大学的AI研究人员已经完成了没有人想到的事情 - 根据周一发布的一份研究报告,他们建立了一种名为S1的AI模型S1,云计算学分低于50美元。

据报道, S1模型与顶级推理模型(包括OpenAI的O1和DeepSeek的R1)提供了表现。更好的是,整个项目都可以在github上找到 - 编码,数据和所有项目。

团队首先抓住了现成的模型,而不是建造新的东西。从那里,他们通过称为蒸馏的过程对其进行了微调。根据他们的研究,他们从Google的Gemini 2.0 Flash思维实验模型中提炼了推理能力。

他们通过从其答案中学习来训练S1,以模仿双子座的解决问题的技术。斯坦福大学研究人员之一尼克拉斯·穆尼基诺夫(Niklas Muennighoff)说:“我们的目标是简单。”

小数据集,很大的结果

对于希望降低成本的人工智能团队来说,蒸馏迅速成为首选武器。伯克利研究人员上个月开发的类似AI模型的培训费用为450美元,但按行业标准却是便宜的。但是,斯坦福大学和西澳大学将其进一步迈出了一步,通过使用较小的数据集和简化技术将其模型提炼出来,将成本降至50美元。

研究人员只对1000个问题进行了挑剔,每个问题都与Google的Gemini 2.0的详细答案和逐步推理配对。该数据集提供了高级执行所需的所有知识S1。根据团队的论文,该模型学会了如何通过问题思考。

监督微调或SFT是进行这项工作的关键。研究人员没有使用大量数据集和大量计算能力的增强学习,而是选择了SFT,这种方法是直接对AI进行了直接训练以模拟数据集中发现的行为的方法。它更便宜,更快,在这种情况下,它起作用了。

基本模型来自阿里巴巴拥有的AI实验室Qwen。他们的现成模型可以免费下载,使该项目更加友好。在不到30分钟的时间内,仅使用16个NVIDIA H100 GPU,该团队完成了训练S1。穆尼霍夫说:“我们今天可以租用必要的计算,价格约为20美元。”

“等待”命令提高了S1的准确性

据报道,研究人员包括提高S1推理的巧妙技巧:他们在解决问题期间添加了“等待”一词。通过告诉模型暂停并仔细检查其工作,它们提高了准确性。该研究论文详细介绍了这项调整如何给S1足够的时间在提交之前考虑更好的答案。

Openai正在密切关注。他们已经指责DeepSeek从其API中收集数据不当来建立AI竞争对手。 S1显示出廉价的复制能力,诸如Openai之类的大型玩家并不激动。 AI模型的商品化可能会损害他们的底线。

但是科技公司还有其他问题。周二,埃隆·马斯克(Elon Musk)的法律团队在奥克兰联邦法庭上对抗OpenAI。埃隆(Elon)是OpenAI的早期投资者,声称该公司放弃了其非营利性使命,并背叛了其最初的目标。

他正在起诉将他们的过渡到完全营利性的业务。埃隆(Elon)的律师马克·托伯夫(Marc Toberoff)周五对法院表示,埃隆(Elon)在成立和2018年之间向OpenAI投资了4500万美元,因为他认为它始终将公共利益优先于利润而不是利润,就像它一开始时会优先考虑公共利益。

法官伊冯·冈萨雷斯·罗杰斯(Yvonne Gonzalez Rogers)称其为“伸展”,并质疑埃隆(Elon)为什么在没有书面trac的情况下甚至会投资这么多钱。她嘲笑说:“这只是握手上的很多钱。” Toberoff律师随后解释说,Elon和Openai的首席执行官Sam Altman当时有着密切的关系,一切都是基于信任的。

但是案件还没有死。法官担心Openai与Microsoft的密切关系。 Openai的董事会参与了两个关键球员 - Linkedin联合创始人Reid Hoffman和Microsoft执行执行Deanna Templeton。邓普顿(Templeton)在2023年短暂罢免后,被添加为非投票成员,但后来在反托拉斯问题上被删除。

埃隆(Elon)希望通过自己的AI Venture Xai制止他们的计划,并有可能对公司进行更多控制权,他将其作为原告添加。 Openai认为,Elon的要求将使其业务ripple ,并基于“牵强”的主张。

Cryptopolitan Academy:免费 Web3 简历备忘单 -立即下载

免责声明:仅供参考。 过去的表现并不预示未来的结果。
placeholder
【今日市场前瞻】英国央行会议来袭!金价回调英国央行会议来袭!料降息25个基点;金价回调,部分投资者获利了结 ;日央行官员放鹰,日元汇率一度升破152>>
作者  Alison Ho
10 小时前
英国央行会议来袭!料降息25个基点;金价回调,部分投资者获利了结 ;日央行官员放鹰,日元汇率一度升破152>>
placeholder
黄金抛售潮突袭!金价短线大跌16美元 FXStreet高级分析师最新金价技术分析24K99讯 周四(2月6日)欧市早盘,现货黄金突然遭遇抛售,金价自2871美元/盎司附近水平大幅回落,目前位于2855美元/盎司附近。FXStreet高级分析师Dhwani Mehta撰文,对金价日内交易进行分析。
作者  FX168
11 小时前
24K99讯 周四(2月6日)欧市早盘,现货黄金突然遭遇抛售,金价自2871美元/盎司附近水平大幅回落,目前位于2855美元/盎司附近。FXStreet高级分析师Dhwani Mehta撰文,对金价日内交易进行分析。
placeholder
特朗普关税大炮延期,美元多头撤退,日元汇率大反弹!TradingKey - 鉴于特朗普关税不确定性以及加墨关税的延期,资金涌向避险资产日圆。再加上日本央行释放进一步升息的利好信号,日元汇率强劲反弹至8周以来最高水平。截至撰稿(2月6日),美元兑日元汇率(USD/JPY)报152.45,本周已连续四日下跌,日元汇率升值1.73%。同期美元指数(DXY)从109.7左右回落至107.5附近。【美元兑日元汇率走势图,来源:Investing.com】分
作者  TradingKey
11 小时前
TradingKey - 鉴于特朗普关税不确定性以及加墨关税的延期,资金涌向避险资产日圆。再加上日本央行释放进一步升息的利好信号,日元汇率强劲反弹至8周以来最高水平。截至撰稿(2月6日),美元兑日元汇率(USD/JPY)报152.45,本周已连续四日下跌,日元汇率升值1.73%。同期美元指数(DXY)从109.7左右回落至107.5附近。【美元兑日元汇率走势图,来源:Investing.com】分
placeholder
澳元/美元在中美贸易紧张局势升级和新关税的影响下依然疲软在周四的欧洲交易时段,澳元/美元汇率走弱至 0.6260 附近,因对美中贸易战紧张局势加剧的担忧以及低于预期的澳大利亚贸易帐数据施压。
作者  FXStreet
11 小时前
在周四的欧洲交易时段,澳元/美元汇率走弱至 0.6260 附近,因对美中贸易战紧张局势加剧的担忧以及低于预期的澳大利亚贸易帐数据施压。
placeholder
迪士尼财报后股价巨震!摩根大通、高盛仍看好其前景由于订阅用户下滑,且指引较为保守,迪士尼股价绩后下跌。不过摩根大通将迪士尼目标价从128美元上调至130美元。
作者  Alison Ho
11 小时前
由于订阅用户下滑,且指引较为保守,迪士尼股价绩后下跌。不过摩根大通将迪士尼目标价从128美元上调至130美元。
goTop
quote