ซึ่งคาดว่าจะทำให้โมเดล AI สามารถตัดสินได้อย่างน่าเชื่อถือเกี่ยวกับการตอบสนองของโมเดล ตามบทความ ของ Reuters แบบจำลองนี้สามารถตรวจสอบและเพิ่มความแม่นยำของการตอบสนองต่อปัญหาที่ยากลำบาก เช่น ในวิชาต่างๆ เช่น วิทยาศาสตร์ คณิตศาสตร์ และการเขียนโค้ด เนื่องจากจะต้องแยกย่อยปัญหาที่ซับซ้อนออกเป็นขั้นตอนเชิงตรรกะที่เล็กลง Meta ได้เปิดเผยความตั้งใจที่จะจัดการกับความท้าทายที่พบกับโมเดล AI อื่น ๆ เช่น ChatGPT นอกเหนือจากการวิพากษ์วิจารณ์เกี่ยวกับคำตอบที่ล้าสมัยและไม่ถูกต้อง มีรายงานว่านักวิจัยที่ Meta ใช้ข้อมูลที่สร้างโดย AI ทั้งหมดเพื่อฝึกโมเดลผู้ประเมิน โดยลบข้อมูลจากมนุษย์ในขั้นตอนนั้นออกไป นักวิจัย Meta สองคนบอกกับรอยเตอร์ว่าความสามารถในการใช้ AI เพื่อประเมิน AI อื่น ๆ ได้อย่างน่าเชื่อถือช่วยให้มองเห็นแนวทางที่เป็นไปได้ในการสร้างระบบอัตโนมัติที่สามารถเรียนรู้จากความผิดพลาดของตนเองได้ “เราหวังว่าเมื่อ AI กลายเป็นยอดมนุษย์มากขึ้นเรื่อยๆ มันจะตรวจสอบงานได้ดีขึ้นเรื่อยๆ และจะดีกว่ามนุษย์ทั่วไปจริงๆ” นักวิจัย เจสัน เวสตัน “แนวคิดในการเรียนรู้ด้วยตนเองและสามารถประเมินตนเองได้นั้นมีความสำคัญอย่างยิ่งต่อแนวคิดในการก้าวไปสู่ระดับ AI ระดับเหนือมนุษย์” เขากล่าวเสริม ตามที่นักวิจัยระบุ ผู้มีส่วนได้ส่วนเสียในอุตสาหกรรม AI มองว่าตัวแทนเหล่านี้เป็นผู้ช่วยดิจิทัลที่ชาญฉลาดพอที่จะดำเนินงานต่างๆ ได้โดยไม่ต้องมีการแทรกแซงของมนุษย์ นักวิจัยยืนยันว่าแบบจำลองการพัฒนาตนเองสามารถตัดความจำเป็นสำหรับกระบวนการที่มักจะมีราคาแพงและไม่มีประสิทธิภาพซึ่งใช้กันในปัจจุบันที่เรียกว่าการเรียนรู้การเสริมกำลังจากผลตอบรับของมนุษย์ สิ่งนี้ต้องการข้อมูลจากผู้อธิบายที่เป็นมนุษย์ซึ่งต้องมีความเชี่ยวชาญเฉพาะทางในการติดป้ายกำกับข้อมูลอย่างถูกต้อง และตรวจสอบว่าคำตอบสำหรับคำถามทางคณิตศาสตร์และการเขียนที่ซับซ้อนนั้นถูกต้อง เพื่อนร่วมงานในอุตสาหกรรมอย่าง Google และ Anthropic ยังได้ตีพิมพ์งานวิจัยเกี่ยวกับแนวคิดของ RLAIF หรือการเรียนรู้แบบเสริมแรงจาก AI Feedback อย่างไรก็ตาม บริษัทอื่นๆ เหล่านี้ไม่เหมือนกับ Meta ตรงที่จะไม่เผยแพร่โมเดลของตนเพื่อการใช้งานสาธารณะ ผู้เชี่ยวชาญในอุตสาหกรรม AI ให้ความเห็นว่าการใช้ AI เพื่อตรวจสอบ AI มีความสำคัญต่อการสร้าง แอปพลิเคชัน AI อัตโนมัติ ที่สามารถทำงานได้โดยไม่ต้องมีการแทรกแซงของมนุษย์ หมายความว่าในที่สุดโมเดล AI จะเรียนรู้จากข้อผิดพลาดของตนเอง แก้ไขตัวเอง และปรับปรุงโดยไม่ต้องอาศัยข้อมูลจากมนุษย์ ยักษ์ใหญ่โซเชียลมีเดียรายนี้ยังได้เปิดตัวเครื่องมืออื่นๆ รวมถึงการอัปเดต image-i dent ification Segment Anything Model (SAM) ซึ่งเป็นเครื่องมือที่ช่วยเร่งเวลาการสร้างการตอบสนองของ LLM และชุดข้อมูลที่สามารถใช้เพื่อช่วยในการค้นพบวัสดุอนินทรีย์ใหม่ๆ Meta ต้องการจัดการกับความท้าทายของความไม่ถูกต้อง
Meta กำลังก้าวไปสู่ AI ที่เป็นอิสระ