根據週一發佈的一份研究報告,據稱,斯坦福大學和華盛頓大學的AI研究人員已經完成了沒有人想到的事情 - 根據週一發佈的一份研究報告,他們建立了一種名爲S1的AI模型S1,雲計算學分低於50美元。
據報道, S1模型與頂級推理模型(包括OpenAI的O1和DeepSeek的R1)提供了表現。更好的是,整個項目都可以在github上找到 - 編碼,數據和所有項目。
團隊首先抓住了現成的模型,而不是建造新的東西。從那裏,他們通過稱爲蒸餾的過程對其進行了微調。根據他們的研究,他們從Google的Gemini 2.0 Flash思維實驗模型中提煉了推理能力。
他們通過從其答案中學習來訓練S1,以模仿雙子座的解決問題的技術。斯坦福大學研究人員之一尼克拉斯·穆尼基諾夫(Niklas Muennighoff)說:“我們的目標是簡單。”
對於希望降低成本的人工智能團隊來說,蒸餾迅速成爲首選武器。伯克利研究人員上個月開發的類似AI模型的培訓費用爲450美元,但按行業標準卻是便宜的。但是,斯坦福大學和西澳大學將其進一步邁出了一步,通過使用較小的數據集和簡化技術將其模型提煉出來,將成本降至50美元。
研究人員只對1000個問題進行了挑剔,每個問題都與Google的Gemini 2.0的詳細答案和逐步推理配對。該數據集提供了高級執行所需的所有知識S1。根據團隊的論文,該模型學會了如何通過問題思考。
監督微調或SFT是進行這項工作的關鍵。研究人員沒有使用大量數據集和大量計算能力的增強學習,而是選擇了SFT,這種方法是直接對AI進行了直接訓練以模擬數據集中發現的行爲的方法。它更便宜,更快,在這種情況下,它起作用了。
基本模型來自阿里巴巴擁有的AI實驗室Qwen。他們的現成模型可以免費下載,使該項目更加友好。在不到30分鐘的時間內,僅使用16個NVIDIA H100 GPU,該團隊完成了訓練S1。穆尼霍夫說:“我們今天可以租用必要的計算,價格約爲20美元。”
據報道,研究人員包括提高S1推理的巧妙技巧:他們在解決問題期間添加了“等待”一詞。通過告訴模型暫停並仔細檢查其工作,它們提高了準確性。該研究論文詳細介紹了這項調整如何給S1足夠的時間在提交之前考慮更好的答案。
Openai正在密切關注。他們已經指責DeepSeek從其API中收集數據不當來建立AI競爭對手。 S1顯示出廉價的複製能力,諸如Openai之類的大型玩家並不激動。 AI模型的商品化可能會損害他們的底線。
但是科技公司還有其他問題。週二,埃隆·馬斯克(Elon Musk)的法律團隊在奧克蘭聯邦法庭上對抗OpenAI。埃隆(Elon)是OpenAI的早期投資者,聲稱該公司放棄了其非營利性使命,並背叛了其最初的目標。
他正在起訴將他們的過渡到完全營利性的業務。埃隆(Elon)的律師馬克·託伯夫(Marc Toberoff)週五對法院表示,埃隆(Elon)在成立和2018年之間向OpenAI投資了4500萬美元,因爲他認爲它始終將公共利益優先於利潤而不是利潤,就像它一開始時會優先考慮公共利益。
法官伊馮·岡薩雷斯·羅傑斯(Yvonne Gonzalez Rogers)稱其爲“伸展”,並質疑埃隆(Elon)爲什麼在沒有書面trac的情況下甚至會投資這麼多錢。她嘲笑說:“這只是握手上的很多錢。” Toberoff律師隨後解釋說,Elon和Openai的首席執行官Sam Altman當時有着密切的關係,一切都是基於信任的。
但是案件還沒有死。法官擔心Openai與Microsoft的密切關係。 Openai的董事會參與了兩個關鍵球員 - Linkedin聯合創始人Reid Hoffman和Microsoft執行執行Deanna Templeton。鄧普頓(Templeton)在2023年短暫罷免後,被添加爲非投票成員,但後來在反托拉斯問題上被刪除。
埃隆(Elon)希望通過自己的AI Venture Xai制止他們的計劃,並有可能對公司進行更多控制權,他將其作爲原告添加。 Openai認爲,Elon的要求將使其業務ripple ,並基於“牽強”的主張。
Cryptopolitan Academy:免費 Web3 簡歷備忘單 -立即下載