OpenAI กล่าวว่าได้เปิดตัวโมเดลภาษาน้ำหนักเปิดสองโมเดลที่โดดเด่นในด้านการอนุมานขั้นสูง และได้รับการปรับให้เหมาะสมเพื่อทำงานบนแล็ปท็อปที่มีระดับประสิทธิภาพที่ใกล้เคียงกับโมเดลอนุมาน 4o-mini ที่เป็นกรรมสิทธิ์
พารามิเตอร์หรือน้ำหนักที่ได้รับการฝึกอบรมของโมเดลภาษาที่มีน้ำหนักแบบเปิดนั้นสามารถเข้าถึงได้โดยสาธารณะ โดยใช้โดยนักพัฒนาเพื่อวิเคราะห์และปรับแต่งโมเดลให้เหมาะกับงานเฉพาะโดยไม่จำเป็นต้องใช้ข้อมูลการฝึกอบรมเดิม
“หนึ่งในสิ่งที่โดดเด่นเกี่ยวกับโมเดลแบบเปิดคือ ผู้คนสามารถรันโมเดลเหล่านี้ภายในเครื่องได้ ผู้คนสามารถรันโมเดลเหล่านี้หลังไฟร์วอลล์ของตัวเอง บนโครงสร้างพื้นฐานของตัวเองได้” เกร็ก บร็อคแมน ผู้ร่วมก่อตั้ง OpenAI กล่าวในข่าวประชาสัมพันธ์

เวอร์ชัน gpt-oss 120B และ 20B สามารถทำงานบนแล็ปท็อปโดยตรงได้
โมเดลภาษาที่มีน้ำหนักเปิดแตกต่างจากโมเดลโอเพนซอร์สตรงที่ให้การเข้าถึงโค้ดต้นฉบับ ข้อมูลการฝึกอบรม และวิธีการทั้งหมด
นอกจากนี้ Amazon ยังประกาศว่าโมเดลน้ำหนักแบบเปิดของ OpenAI พร้อมให้บริการแล้วบน Bedrock Generative AI Marketplace ของ Amazon Web Services Atul Deo ผู้จัดการผลิตภัณฑ์ของ Bedrock กล่าวว่า นี่เป็นครั้งแรกที่มีโมเดล OpenAI ให้บริการบน Bedrock
“OpenAI ได้พัฒนาโมเดลที่ยอดเยี่ยมมาโดยตลอด และเราเชื่อว่าโมเดลเหล่านี้จะเป็นตัวเลือกโอเพนซอร์สหรือตัวเลือกการสร้างแบบจำลองแบบเปิดที่ยอดเยี่ยมสำหรับลูกค้า” ดีโอกล่าวในการสัมภาษณ์ เขาปฏิเสธที่จะหารือเกี่ยวกับข้อตกลงทางสัญญาใดๆ ระหว่าง AWS และ OpenAI
เมื่อสัปดาห์ที่แล้ว Amazon ได้รายงานว่าการเติบโตในหน่วย AWS ของตนชะลอตัวลง โดยเฉพาะเมื่อเปรียบเทียบกับคู่แข่ง

รุ่น gpt-oss-20b มีจำหน่ายบนแพลตฟอร์มอีคอมเมิร์ซ Sage Maker
ภูมิทัศน์ของโมเดล AI โอเพนซอร์สและน้ำหนักแบบเปิดเป็นประเด็นถกเถียงกันอย่างมากในปีนี้ ก่อนหน้านี้ โมเดล Llama ของ META ได้รับการยกย่องว่าดีที่สุด แต่ในช่วงต้นปีนี้ สถานการณ์ได้เปลี่ยนไปเมื่อ DeepSeek ของจีนเปิดตัวโมเดลการให้เหตุผลที่ทรงพลังและคุ้มค่า ขณะที่ Meta ประสบปัญหาในการพัฒนา Llama 4
โมเดล OpenAI ใหม่ทั้งสองโมเดลนี้เป็นโมเดลเปิดรุ่นแรกที่ OpenAI เปิดตัวนับตั้งแต่ GPT-2 ซึ่งเปิดตัวในปี 2019
OpenAI กล่าวว่าโมเดลขนาดใหญ่กว่าคือ gpt-oss-120b สามารถทำงานบน GPU ตัวเดียวได้ ส่วนโมเดลที่สองคือ gpt-oss-20b ซึ่งมีขนาดเล็กพอที่จะทำงานบนคอมพิวเตอร์ส่วนบุคคลได้โดยตรง
OpenAI กล่าวว่าโมเดลเหล่านี้ทำงานในลักษณะเดียวกับโมเดลอนุมานที่เป็นกรรมสิทธิ์ของบริษัทที่เรียกว่า o3-mini และ o4-mini และมีความโดดเด่นเป็นพิเศษในด้านการเขียนโปรแกรม คณิตศาสตร์เชิงแข่งขัน และการค้นหาข้อมูลที่เกี่ยวข้องกับสุขภาพ
โมเดลเหล่านี้ได้รับการฝึกฝนบนชุดข้อมูลแบบข้อความล้วน ซึ่งมุ่งเน้นไปที่ วิทยาศาสตร์ คณิตศาสตร์ และการเขียนโปรแกรม นอกเหนือจากความรู้ทั่วไป OpenAI ไม่ได้เผยแพร่เกณฑ์มาตรฐานที่เปรียบเทียบโมเดลแบบเปิดของตนกับโมเดลคู่แข่งอย่าง DeepSeek-R1
OpenAI ที่ได้รับการสนับสนุนจาก Microsoft ซึ่งปัจจุบันมีมูลค่า 300,000 ล้านดอลลาร์ กำลังระดมทุนเพิ่มขึ้น 40,000 ล้านดอลลาร์ในรอบการระดมทุนใหม่ที่นำโดย Softbank Group
ที่มา: https://khoahocdoisong.vn/openai-phat-hanh-phien-ban-open-weight-co-the-chay-tren-laptop-post2149044060.html
การแสดงความคิดเห็น (0)