DeepSeek以透明AI突破挑战OpenAI,在3个参数上击败OpenAI

来源 Cryptopolitan

,预览版在 AIME(美国matic邀请赛)和 MATH 等衡量问题解决和推理能力的基准测试中表现良好。由于人工智能似乎擅长处理复杂的matic和逻辑问题,它可能已经准备好与 OpenAI 的 ChatGPT,特别是 OpenAI o1 竞争。

本周,Mistral AI 的 Le Chat 也宣布了更新,允许免费访问新功能。这些产品的推出似乎在生成人工智能市场上引发了激烈的竞争,克服了其他产品的缺点。

DeepSeek与 ChatGPT 不同的是大声思考

DeepSeek表示,其人工智能可以显示分步实时推理,使其思维过程更加透明。与此同时,这家人工智能公司还表示,他们将在未来几天发布开源模型和API开发工具。

根据人工智能和技术评论员 Andrew Curran 引用的对比图表,DeepSeek-R1-Lite-Preview 在 AIME (52.5) 和 Codeforces (1450) 等参数上取得了最高分,优于 OpenAI o1-preview 和 Claude 3.5 Sonnet 等竞争对手。

它还在 MATH-500 (91.6) 中领先,表明在高级问题解决任务中表现出色。然而,与 OpenAI o1-preview(分别为 73.3 和 71.4)等模型相比,它在 GPQA Diamond(58.5)和 Zebra Logic(56.6)方面落后。这些数字意味着常识和逻辑推理部分还有改进的空间。