DeepSeek ท้าทาย OpenAI ด้วยความก้าวหน้าของ AI ที่โปร่งใส เอาชนะ OpenAI ใน 3 พารามิเตอร์

แหล่งที่มา Cryptopolitan

การแสดงตัวอย่างทำงานได้ดีกับเกณฑ์มาตรฐาน เช่น AIME (American Invitational Mathe matic s Examination) และ MATH ซึ่งวัดความสามารถในการแก้ปัญหาและการให้เหตุผล เนื่องจาก AI ดูเหมือนว่ามีทักษะในการจัดการกับปัญหาทาง matic และตรรกะที่ซับซ้อน มันจึงอาจพร้อมที่จะแข่งขันกับ ChatGPT ของ OpenAI และโดยเฉพาะกับ OpenAI o1

สัปดาห์นี้ Le Chat ของ Mistral AI ยังได้ประกาศอัปเดตเพื่อให้สามารถเข้าถึงฟีเจอร์ใหม่ๆ ได้ฟรี การเปิดตัวดูเหมือนจะสร้างการแข่งขันที่รุนแรงในตลาด AI ทั่วไป โดยเอาชนะข้อบกพร่องของอีกฝ่าย

DeepSeek คิดออกมา ดังๆ ไม่เหมือน ChatGPT

DeepSeek กล่าว ว่า AI สามารถแสดงเหตุผลแบบเรียลไทม์ทีละขั้นตอนเพื่อทำให้กระบวนการคิดมีความโปร่งใสมากขึ้น ในขณะเดียวกัน บริษัท AI ยังกล่าวอีก ว่าพวกเขา จะเปิดตัวโมเดลโอเพ่นซอร์สและเครื่องมือสำหรับนักพัฒนา API ในอีกไม่กี่วันข้างหน้า

ตามแผนภูมิเปรียบเทียบ ที่ AI และผู้วิจารณ์เทคโนโลยี Andrew Curran อ้างถึง DeepSeek-R1-Lite-Preview ได้รับคะแนนสูงสุดในพารามิเตอร์ เช่น AIME (52.5) ​​และ Codeforces (1450) ซึ่งเหนือกว่าคู่แข่งอย่าง OpenAI o1-preview และ Claude 3.5 Sonnet

นอกจากนี้ยังเป็นผู้นำใน MATH-500 (91.6) ซึ่งบ่งบอกถึงประสิทธิภาพสูงในงานแก้ไขปัญหาขั้นสูง อย่างไรก็ตาม มันล่าช้าใน GPQA Diamond (58.5) และ Zebra Logic (56.6) เมื่อเทียบกับรุ่นอย่าง OpenAI o1-preview (73.3 และ 71.4 ตามลำดับ) ตัวเลขดัง กล่าวหมายความว่ายังมี พื้นที่สำหรับการปรับปรุงในส่วนของความรู้ทั่วไปและการให้เหตุผลเชิงตรรกะ