DeepSeek以透明AI突破挑戰OpenAI,在3個參數上擊敗OpenAI

來源 Cryptopolitan

,預覽版在 AIME(美國matic邀請賽)和 MATH 等衡量問題解決和推理能力的基準測試中表現良好。由於人工智能似乎擅長處理複雜的matic和邏輯問題,它可能已經準備好與 OpenAI 的 ChatGPT,特別是 OpenAI o1 競爭。

本週,Mistral AI 的 Le Chat 也宣佈了更新,允許免費訪問新功能。這些產品的推出似乎在生成人工智能市場上引發了激烈的競爭,克服了其他產品的缺點。

DeepSeek與 ChatGPT 不同的是大聲思考

DeepSeek表示,其人工智能可以顯示分步實時推理,使其思維過程更加透明。與此同時,這家人工智能公司還表示,他們將在未來幾天發佈開源模型和API開發工具。

根據人工智能和技術評論員 Andrew Curran 引用的對比圖表,DeepSeek-R1-Lite-Preview 在 AIME (52.5) 和 Codeforces (1450) 等參數上取得了最高分,優於 OpenAI o1-preview 和 Claude 3.5 Sonnet 等競爭對手。

它還在 MATH-500 (91.6) 中領先,表明在高級問題解決任務中表現出色。然而,與 OpenAI o1-preview(分別爲 73.3 和 71.4)等模型相比,它在 GPQA Diamond(58.5)和 Zebra Logic(56.6)方面落後。這些數字意味着常識和邏輯推理部分還有改進的空間。