斯坦福大學和大學研究人員建造$ 50開源Chatgpt O1競爭對手

來源 Cryptopolitan

根據週一發佈的一份研究報告,據稱,斯坦福大學和華盛頓大學的AI研究人員已經完成了沒有人想到的事情 - 根據週一發佈的一份研究報告,他們建立了一種名爲S1的AI模型S1,雲計算學分低於50美元。

據報道, S1模型與頂級推理模型(包括OpenAI的O1和DeepSeek的R1)提供了表現。更好的是,整個項目都可以在github上找到 - 編碼,數據和所有項目。

團隊首先抓住了現成的模型,而不是建造新的東西。從那裏,他們通過稱爲蒸餾的過程對其進行了微調。根據他們的研究,他們從Google的Gemini 2.0 Flash思維實驗模型中提煉了推理能力。

他們通過從其答案中學習來訓練S1,以模仿雙子座的解決問題的技術。斯坦福大學研究人員之一尼克拉斯·穆尼基諾夫(Niklas Muennighoff)說:“我們的目標是簡單。”

小數據集,很大的結果

對於希望降低成本的人工智能團隊來說,蒸餾迅速成爲首選武器。伯克利研究人員上個月開發的類似AI模型的培訓費用爲450美元,但按行業標準卻是便宜的。但是,斯坦福大學和西澳大學將其進一步邁出了一步,通過使用較小的數據集和簡化技術將其模型提煉出來,將成本降至50美元。

研究人員只對1000個問題進行了挑剔,每個問題都與Google的Gemini 2.0的詳細答案和逐步推理配對。該數據集提供了高級執行所需的所有知識S1。根據團隊的論文,該模型學會了如何通過問題思考。

監督微調或SFT是進行這項工作的關鍵。研究人員沒有使用大量數據集和大量計算能力的增強學習,而是選擇了SFT,這種方法是直接對AI進行了直接訓練以模擬數據集中發現的行爲的方法。它更便宜,更快,在這種情況下,它起作用了。

基本模型來自阿里巴巴擁有的AI實驗室Qwen。他們的現成模型可以免費下載,使該項目更加友好。在不到30分鐘的時間內,僅使用16個NVIDIA H100 GPU,該團隊完成了訓練S1。穆尼霍夫說:“我們今天可以租用必要的計算,價格約爲20美元。”

“等待”命令提高了S1的準確性

據報道,研究人員包括提高S1推理的巧妙技巧:他們在解決問題期間添加了“等待”一詞。通過告訴模型暫停並仔細檢查其工作,它們提高了準確性。該研究論文詳細介紹了這項調整如何給S1足夠的時間在提交之前考慮更好的答案。

Openai正在密切關注。他們已經指責DeepSeek從其API中收集數據不當來建立AI競爭對手。 S1顯示出廉價的複製能力,諸如Openai之類的大型玩家並不激動。 AI模型的商品化可能會損害他們的底線。

但是科技公司還有其他問題。週二,埃隆·馬斯克(Elon Musk)的法律團隊在奧克蘭聯邦法庭上對抗OpenAI。埃隆(Elon)是OpenAI的早期投資者,聲稱該公司放棄了其非營利性使命,並背叛了其最初的目標。

他正在起訴將他們的過渡到完全營利性的業務。埃隆(Elon)的律師馬克·託伯夫(Marc Toberoff)週五對法院表示,埃隆(Elon)在成立和2018年之間向OpenAI投資了4500萬美元,因爲他認爲它始終將公共利益優先於利潤而不是利潤,就像它一開始時會優先考慮公共利益。

法官伊馮·岡薩雷斯·羅傑斯(Yvonne Gonzalez Rogers)稱其爲“伸展”,並質疑埃隆(Elon)爲什麼在沒有書面trac的情況下甚至會投資這麼多錢。她嘲笑說:“這只是握手上的很多錢。” Toberoff律師隨後解釋說,Elon和Openai的首席執行官Sam Altman當時有着密切的關係,一切都是基於信任的。

但是案件還沒有死。法官擔心Openai與Microsoft的密切關係。 Openai的董事會參與了兩個關鍵球員 - Linkedin聯合創始人Reid Hoffman和Microsoft執行執行Deanna Templeton。鄧普頓(Templeton)在2023年短暫罷免後,被添加爲非投票成員,但後來在反托拉斯問題上被刪除。

埃隆(Elon)希望通過自己的AI Venture Xai制止他們的計劃,並有可能對公司進行更多控制權,他將其作爲原告添加。 Openai認爲,Elon的要求將使其業務ripple ,並基於“牽強”的主張。

Cryptopolitan Academy:免費 Web3 簡歷備忘單 -立即下載

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
【今日市場前瞻】英國央行會議來襲!金價回調英國央行會議來襲!料降息25個基點;金價回調,部分投資者獲利了結;日央行官員放鷹,日幣匯率一度升破152>>
作者  Alison Ho
10 小時前
英國央行會議來襲!料降息25個基點;金價回調,部分投資者獲利了結;日央行官員放鷹,日幣匯率一度升破152>>
placeholder
黃金拋售潮突襲!金價短線大跌16美元 FXStreet高級分析師最新金價技術分析24K99訊 週四(2月6日)歐市早盤,現貨黃金突然遭遇拋售,金價自2871美元/盎司附近水平大幅回落,目前位於2855美元/盎司附近。FXStreet高級分析師Dhwani Mehta撰文,對金價日內交易進行分析。
作者  FX168
10 小時前
24K99訊 週四(2月6日)歐市早盤,現貨黃金突然遭遇拋售,金價自2871美元/盎司附近水平大幅回落,目前位於2855美元/盎司附近。FXStreet高級分析師Dhwani Mehta撰文,對金價日內交易進行分析。
placeholder
川普關稅大炮延期,美元多頭撤退,日元匯率大反彈!TradingKey - 鑒於川普關稅不確定性以及加墨關稅的延期,資金湧向避險資產日圓。再加上日本央行釋放進一步升息的利好信號,日幣匯率強勁反彈至8週以來最高水平。截至撰稿(2月6日),美元兌日幣匯率(USD/JPY)報152.45,本週已連續四日下跌,日幣匯率升值1.73%。同期美元指數(DXY)從109.7左右回落至107.5附近。【美元兌日幣匯率走勢圖,來源:Investing.com】分析
作者  TradingKey
11 小時前
TradingKey - 鑒於川普關稅不確定性以及加墨關稅的延期,資金湧向避險資產日圓。再加上日本央行釋放進一步升息的利好信號,日幣匯率強勁反彈至8週以來最高水平。截至撰稿(2月6日),美元兌日幣匯率(USD/JPY)報152.45,本週已連續四日下跌,日幣匯率升值1.73%。同期美元指數(DXY)從109.7左右回落至107.5附近。【美元兌日幣匯率走勢圖,來源:Investing.com】分析
placeholder
財報後迪士尼股價巨震!摩根大通、高盛仍看好其前景由於訂閱用戶下滑,且指引較保守,迪士尼股價績後下跌。不過摩根大通將迪士尼目標價從128美元上調至130美元。
作者  Alison Ho
11 小時前
由於訂閱用戶下滑,且指引較保守,迪士尼股價績後下跌。不過摩根大通將迪士尼目標價從128美元上調至130美元。
placeholder
【美股解碼】英偉達與超微電腦的互相成全英偉達(NVDA.US)和超微電腦(SMCI.US)近日股價罕見地雙雙大漲,其中超微電腦的股價於2025年2月5日大漲7.99%,盤後再漲2.19%;英偉達則大漲5.21%。
作者  財華社
12 小時前
英偉達(NVDA.US)和超微電腦(SMCI.US)近日股價罕見地雙雙大漲,其中超微電腦的股價於2025年2月5日大漲7.99%,盤後再漲2.19%;英偉達則大漲5.21%。
goTop
quote