OpenAI เพื่อพัฒนาโมเดล AI o1 และ o3 ด้วยกระบวนทัศน์การฝึกอบรมด้านความปลอดภัยใหม่

แหล่งที่มา Cryptopolitan

เมื่อวันศุกร์ OpenAI ได้ประกาศเปิดตัวโมเดล AI ตระกูลใหม่ซึ่งมีชื่อว่า o3 บริษัทอ้างว่าผลิตภัณฑ์ใหม่มีความล้ำหน้ากว่ารุ่นก่อนๆ รวมถึง o1 ด้วย ความก้าวหน้าตามการเริ่มต้นนั้นเกิดจากการปรับปรุงการปรับขนาดการคำนวณเวลาทดสอบ หัวข้อที่ได้รับการสำรวจในช่วงไม่กี่เดือนที่ผ่านมา และจากการแนะนำกระบวนทัศน์ด้านความปลอดภัยใหม่ที่ใช้ในการฝึกโมเดลเหล่านี้

OpenAI เป็นส่วนหนึ่งของความมุ่งมั่นอย่างต่อเนื่องในการปรับปรุงความปลอดภัยของ AI โดยได้แบ่งปัน งานวิจัย ใหม่ที่มีรายละเอียดเกี่ยวกับการดำเนินการ "การจัดตำแหน่งโดยเจตนา" วิธีการรักษาความปลอดภัยใหม่นี้มีจุดมุ่งหมายเพื่อให้แน่ใจว่าโมเดลการใช้เหตุผลของ AI สอดคล้องกับค่านิยมที่กำหนดโดยนักพัฒนา

แนวทางนี้ตามคำกล่าวอ้างของ OpenAI ใช้เพื่อปรับปรุงการจัดตำแหน่งของทั้งโมเดล o1 และ o3 โดยแนะนำให้พวกเขาคิดเกี่ยวกับนโยบายความปลอดภัยของ OpenAI ในระหว่างขั้นตอนการอนุมาน ขั้นตอนการอนุมานคือระยะเวลาหลังจากที่ผู้ใช้ส่งข้อความแจ้งไปยังโมเดลและก่อนที่โมเดลจะสร้างการตอบกลับ

ในการวิจัย OpenAI ตั้งข้อสังเกตว่าการจัดตำแหน่งโดยเจตนาส่งผลให้อัตราที่แบบจำลองสร้างคำตอบหรือการตอบสนองที่ "ไม่ปลอดภัย" ซึ่งบริษัทพิจารณาว่าเป็นการละเมิดนโยบายด้านความปลอดภัย ในขณะเดียวกันก็ปรับปรุงความสามารถของแบบจำลองในการตอบคำถามที่ไม่เป็นอันตรายได้อย่างมีประสิทธิภาพมากขึ้น

การจัดตำแหน่งโดยเจตนาทำงานอย่างไร

โดยแก่นแท้แล้ว กระบวนการนี้ทำงานโดยให้แบบจำลองเตรียมการล่วงหน้าอีกครั้งในระหว่างขั้นตอนห่วงโซ่แห่งความคิด ตัวอย่างเช่น หลังจากที่ผู้ใช้ส่งคำถามไปที่ ChatGPT โมเดลการให้เหตุผลของ AI จะใช้เวลาตั้งแต่ไม่กี่วินาทีไปจนถึงหลายนาทีเพื่อแยกปัญหาออกเป็นขั้นตอนเล็กๆ

จากนั้นแบบจำลองจะสร้างคำตอบตามกระบวนการคิดของพวกเขา ในกรณีของการจัดแนวโดยเจตนา โมเดลจะรวมนโยบายความปลอดภัยของ OpenAI เป็นส่วนหนึ่งของ "การพิจารณา" ภายในนี้

OpenAI ฝึกฝนโมเดลต่างๆ ซึ่งรวมถึง o1 และ o3 เพื่อเรียกคืนส่วนต่างๆ ของนโยบายด้านความปลอดภัยของบริษัท ซึ่งเป็นส่วนหนึ่งของกระบวนการคิดแบบลูกโซ่นี้ การทำเช่นนี้เพื่อให้แน่ใจว่าเมื่อต้องเผชิญกับคำถามที่ละเอียดอ่อนหรือไม่ปลอดภัย โมเดลจะควบคุมตนเองและปฏิเสธที่จะให้คำตอบที่อาจก่อให้เกิดอันตราย

อย่างไรก็ตาม การใช้คุณลักษณะด้านความปลอดภัยนี้ได้รับการพิสูจน์แล้วว่ามีความท้าทาย เนื่องจากนักวิจัยของ OpenAI ต้องแน่ใจว่าการตรวจสอบความปลอดภัยเพิ่มเติมนั้นจะไม่ส่งผลเสียต่อความเร็วและประสิทธิภาพของโมเดล

ตัวอย่างที่ให้ไว้ในการวิจัยของ OpenAI ที่ TechCrunch อ้างถึง แสดงให้เห็นว่าแบบจำลองใช้การจัดตำแหน่งโดยเจตนาเพื่อตอบสนองต่อคำขอที่อาจเป็นอันตรายอย่างปลอดภัยได้อย่างไร ในตัวอย่างนี้ ผู้ใช้ถามว่าจะสร้างป้ายจอดรถของคนพิการที่สมจริงได้อย่างไร

ในระหว่างกระบวนการคิดภายในของโมเดล โมเดลจะเรียกคืนนโยบายความปลอดภัยของ OpenAI โดยตระหนักว่าคำขอนั้นเกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย (การปลอมป้ายจอดรถ) และปฏิเสธที่จะช่วยเหลือ และขออภัยสำหรับการปฏิเสธ

การพิจารณาภายในประเภทนี้เป็นส่วนสำคัญของวิธีที่ OpenAI ทำงานเพื่อปรับโมเดลให้สอดคล้องกับโปรโตคอลความปลอดภัย แทนที่จะปิดกั้นการแจ้งเตือนใดๆ ที่เกี่ยวข้องกับหัวข้อที่ละเอียดอ่อน เช่น "ระเบิด" ซึ่งจะจำกัดการตอบสนองของแบบจำลองมากเกินไป การจัดตำแหน่งโดยเจตนาช่วยให้ AI สามารถประเมินบริบทเฉพาะของการแจ้งเตือน และทำการตัดสินใจที่เหมาะสมยิ่งขึ้นว่า หรือไม่ตอบ

นอกจากความก้าวหน้าด้านความปลอดภัยแล้ว OpenAI ยังได้แชร์ผลลัพธ์จากการทดสอบการเปรียบเทียบประสิทธิภาพที่แสดงให้เห็นถึงประสิทธิผลของการจัดตำแหน่งโดยเจตนาในการปรับปรุงประสิทธิภาพของโมเดล เกณฑ์มาตรฐานหนึ่งเรียกว่า Pareto วัดความต้านทานของโมเดลต่อการเจลเบรกทั่วไป และพยายามเลี่ยงการป้องกันของ AI

ในการทดสอบเหล่านี้ โมเดล o1-preview ของ OpenAI มีประสิทธิภาพเหนือกว่ารุ่นยอดนิยมอื่นๆ เช่น GPT-4o, Gemini 1.5 Flash และ Claude 3.5 Sonnet ในแง่ของการหลีกเลี่ยงเอาต์พุตที่ไม่ปลอดภัย

หน่วยงานคุ้มครองข้อมูลของอิตาลีปรับ OpenAI ฐานละเมิดความเป็นส่วนตัว

ในการพัฒนาที่แยกต่างหากแต่เกี่ยวข้องกัน OpenAI ถูกปรับ 15 ล้านยูโร (15.58 ล้านดอลลาร์) โดย Garante ซึ่งเป็นหน่วยงานปกป้องข้อมูลของอิตาลี หลังจากการสอบสวนการจัดการข้อมูลส่วนบุคคลของบริษัท

ค่าปรับดังกล่าวเกิดขึ้นจากการค้นพบของหน่วยงานว่า OpenAI ประมวลผลข้อมูลส่วนบุคคลของผู้ใช้โดยไม่มีพื้นฐานทางกฎหมาย ซึ่งเป็นการละเมิดความโปร่งใสและภาระผูกพันด้านข้อมูลผู้ใช้ที่กำหนดโดยกฎหมายความเป็นส่วนตัวของสหภาพยุโรป

ตามรายงานของ Reuters การสอบสวนซึ่งเริ่มขึ้นในปี 2566 ยังเผยให้เห็นว่า OpenAI ไม่มีระบบการตรวจสอบอายุที่เพียงพอ อาจทำให้เด็กอายุต่ำกว่า 13 ปีเข้าถึงเนื้อหาที่สร้างโดย AI ที่ไม่เหมาะสม

Garante หนึ่งในหน่วยงานกำกับดูแล AI ที่เข้มงวดที่สุดของสหภาพยุโรป สั่งให้ OpenAI เปิดตัวแคมเปญสาธารณะระยะเวลา 6 เดือนในอิตาลีเพื่อสร้างความตระหนักรู้เกี่ยวกับ แนวทางปฏิบัติในการรวบรวมข้อมูล ของ ChatGPT โดยเฉพาะอย่างยิ่งการใช้ข้อมูลส่วนบุคคลเพื่อฝึกอัลกอริทึม

เพื่อเป็นการตอบสนอง OpenAI อธิบายว่าค่าปรับนั้น “ไม่สมส่วน” และระบุความตั้งใจที่จะอุทธรณ์คำตัดสิน บริษัทยังวิพากษ์วิจารณ์ค่าปรับดังกล่าวว่ามากเกินไปเมื่อเทียบกับรายได้ในอิตาลีในช่วงเวลาที่เกี่ยวข้อง

Garante ยังตั้งข้อสังเกตอีกว่าค่าปรับนั้นคำนวณโดยพิจารณาจาก “จุดยืนความร่วมมือ” ของ OpenAI ซึ่งหมายความว่าค่าปรับอาจสูงกว่านี้หากบริษัทไม่ถูกมองว่าให้ความร่วมมือในระหว่างการสอบสวน

ค่าปรับครั้งล่าสุดนี้ไม่ใช่ครั้งแรกที่ OpenAI เผชิญกับการตรวจสอบข้อเท็จจริงในอิตาลี เมื่อปีที่แล้ว Garante สั่งห้าม การใช้งาน ChatGPT ในอิตาลีในช่วงสั้นๆ เนื่องจากถูกกล่าวหาว่าละเมิดกฎความเป็นส่วนตัวของสหภาพยุโรป บริการนี้ได้รับการคืนสถานะอีกครั้งหลังจาก OpenAI จัดการกับข้อกังวล รวมถึงการอนุญาตให้ผู้ใช้ปฏิเสธความยินยอมในการใช้ข้อมูลส่วนบุคคลเพื่อฝึกอัลกอริทึม

ได้งาน Web3 ที่จ่ายสูงใน 90 วัน: สุดยอดโรดแมป

ข้อจำกัดความรับผิดชอบ: เพื่อการอ้างอิงเท่านั้น ผลการดำเนินงานในอดีตไม่ได้บ่งบอกถึงผลลัพธ์ในอนาคต
placeholder
การคาดการณ์ราคาหุ้น AAPL: ภายในปี 2566 นี้ จะสามารถกลับคืนสู่มูลค่าตลาด 3 ล้านล้าน ได้หรือไม่?การลดลงของราคาหุ้นของ Apple มีสาเหตุหลักมาจากปัจจัยด้านลบและทัศนคติเชิงลบของนักลงทุนที่มีต่อตลาดโดยรวม คุณค่าที่แท้จริง รวมถึงประสิทธิภาพของผลิตภัณฑ์ และ บริการ Apple จะยังคงเป็นปัจจัยเชิงบวกได้ตลอดทั้งปี 2022 ปัจจัยลบระดับมหภาคที่ส่งผลต่อราคาหุ้น Apple จะค่อยๆ อ่อนตัวลงในปี 2566
ผู้เขียน  Mitrade
วันที่ 08 มิ.ย. 2023
การลดลงของราคาหุ้นของ Apple มีสาเหตุหลักมาจากปัจจัยด้านลบและทัศนคติเชิงลบของนักลงทุนที่มีต่อตลาดโดยรวม คุณค่าที่แท้จริง รวมถึงประสิทธิภาพของผลิตภัณฑ์ และ บริการ Apple จะยังคงเป็นปัจจัยเชิงบวกได้ตลอดทั้งปี 2022 ปัจจัยลบระดับมหภาคที่ส่งผลต่อราคาหุ้น Apple จะค่อยๆ อ่อนตัวลงในปี 2566
placeholder
WTI ยังคงต่ำกว่า $70.00 เนื่องจากข้อมูลจีนที่อ่อนแอทำให้เกิดความกังวลเกี่ยวกับความต้องการWest Texas Intermediate (WTI) ซึ่งเป็นเกณฑ์ราคามาตรฐานของน้ำมันดิบสหรัฐฯ ซื้อขายอยู่ที่ประมาณ 69.70 ดอลลาร์ในวันพุธ
ผู้เขียน  FXStreet
12 เดือน 18 วัน พุธ
West Texas Intermediate (WTI) ซึ่งเป็นเกณฑ์ราคามาตรฐานของน้ำมันดิบสหรัฐฯ ซื้อขายอยู่ที่ประมาณ 69.70 ดอลลาร์ในวันพุธ
placeholder
NZD/USD ลอยตัวต่ำกว่า 0.5650 เนื่องจาก GDP ที่อ่อนแอหนุนการเก็งการลดอัตราดอกเบี้ยของ RBNZในตลาดลงทุนเอเชียวันศุกร์ คู่ NZDUSD ยังคงอยู่ภายใต้แรงขายที่บริเวณ 0.5625
ผู้เขียน  FXStreet
12 เดือน 20 วัน ศุกร์
ในตลาดลงทุนเอเชียวันศุกร์ คู่ NZDUSD ยังคงอยู่ภายใต้แรงขายที่บริเวณ 0.5625
placeholder
GBP/USD ดีดตัวขึ้นสู่ระดับ 1.2540 หลังประกาศข้อมูลเงินเฟ้อของสหรัฐฯ และการประชุมดอกเบี้ยของ BoEคู่ GBP/USD ดีดตัวขึ้นสู่ระดับ 1.2540 หลังจากการเปิดเผยข้อมูลเงินเฟ้อของสหรัฐฯ และการตัดสินใจนโยบายการเงินของธนาคารกลางอังกฤษ (BoE) ในวันพฤหัสบดี ในขณะเดียวกัน ทั้งคู่ได้รับประโยชน์จากข้อมูลการใช้จ่ายเพื่อการบริโภคส่วนบุคคล (PCE) ของสหรัฐฯ ที่อ่อนแอกว่าที่คาดการณ์ไว้ แต่ท่าทีที่ระมัดระวังของ BoE เกี่ยวกับการปรับลดอัตราดอกเบี้ยและข้อมูลยอดค้าปลีกของสหราชอาณาจักรที่อ่อนแอลงทําให้ขาขึ้นยังคงอยู่
ผู้เขียน  FXStreet
14 ชั่วโมงที่แล้ว
คู่ GBP/USD ดีดตัวขึ้นสู่ระดับ 1.2540 หลังจากการเปิดเผยข้อมูลเงินเฟ้อของสหรัฐฯ และการตัดสินใจนโยบายการเงินของธนาคารกลางอังกฤษ (BoE) ในวันพฤหัสบดี ในขณะเดียวกัน ทั้งคู่ได้รับประโยชน์จากข้อมูลการใช้จ่ายเพื่อการบริโภคส่วนบุคคล (PCE) ของสหรัฐฯ ที่อ่อนแอกว่าที่คาดการณ์ไว้ แต่ท่าทีที่ระมัดระวังของ BoE เกี่ยวกับการปรับลดอัตราดอกเบี้ยและข้อมูลยอดค้าปลีกของสหราชอาณาจักรที่อ่อนแอลงทําให้ขาขึ้นยังคงอยู่
placeholder
ราคาทองคำยังคงอยู่เหนือระดับ $2,600 อย่างสบาย; ขาดความเชื่อมั่นในขาขึ้นราคาทองคํา (XAUUSD) พยายามที่จะใช้ประโยชน์จากการฟื้นตัวเล็กน้อยจากระดับต่ำสุดในรอบหนึ่งเดือนเมื่อสัปดาห์ที่แล้ว และแกว่งตัวอยู่ในกรอบบริเวณ $2,625 ในช่วงเช้าของตลาดลงทุนเอเชียวันจันทร์
ผู้เขียน  FXStreet
8 ชั่วโมงที่แล้ว
ราคาทองคํา (XAUUSD) พยายามที่จะใช้ประโยชน์จากการฟื้นตัวเล็กน้อยจากระดับต่ำสุดในรอบหนึ่งเดือนเมื่อสัปดาห์ที่แล้ว และแกว่งตัวอยู่ในกรอบบริเวณ $2,625 ในช่วงเช้าของตลาดลงทุนเอเชียวันจันทร์
goTop
quote