สามารถดาวน์โหลดโมเดลเหล่านี้ได้จากแพลตฟอร์ม Hugging Face ซึ่งเป็นส่วนหนึ่งของชุดโมเดลใหม่ที่ DeepSeek เรียกว่า Janus-Pro มีขนาดตั้งแต่ 1 พันล้านถึง 7 พันล้านพารามิเตอร์ ยิ่งจำนวนพารามิเตอร์มากขึ้นเท่าใด โมเดลก็จะทำงานได้ดีขึ้นเท่านั้น

9rn0s3d3.png
เปรียบเทียบความสามารถในการสร้างภาพจากข้อความของ Janus-Pro และ Janus ภาพ: DeepSeek

Janus-Pro สามารถวิเคราะห์และสร้างภาพใหม่ได้ ตามรายงานของ DeepSeek พบว่าจากเกณฑ์มาตรฐาน AI สองรายการคือ GenEval และ DPG-Bench Janus-Pro-7B เอาชนะ Dall-E 3 รวมถึงรุ่นอื่นๆ เช่น PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ได้

อย่างไรก็ตาม ตามข้อมูลของ TechCrunch รุ่น Janus-Pro ที่เหลือส่วนใหญ่สามารถวิเคราะห์ภาพขนาดเล็กได้เท่านั้น โดยมีความละเอียดสูงสุดที่ 384 x 384 อย่างไรก็ตาม ประสิทธิภาพของ Janus-Pro ถือว่าน่าประทับใจ เมื่อพิจารณาจากขนาดที่กะทัดรัดของมัน

DeepSeek สตาร์ทอัพน้องใหม่ของจีนที่ก่อตั้งในปี 2023 ได้รับความสนใจอย่างกะทันหันในช่วงไม่กี่วันที่ผ่านมา หลังจากแชทบอทของบริษัทไต่อันดับขึ้นไปอยู่ในอันดับสูงสุดของการจัดอันดับ App Store ในสหรัฐอเมริกา โมเดลภาษาจำนวนมหาศาลของบริษัทสตาร์ทอัพ ซึ่งได้รับการฝึกอบรมโดยใช้เทคนิคที่มีประสิทธิภาพในการคำนวณและคุ้มต้นทุน ทำให้วอลล์สตรีทเกิดคำถามว่าสหรัฐฯ สามารถรักษาตำแหน่งผู้นำในการแข่งขันด้าน AI ได้หรือไม่ และความต้องการชิป AI จะยั่งยืนได้หรือไม่

เมื่อวันที่ 27 มกราคม DeepSeek กล่าวว่าจะจำกัดการลงทะเบียนผู้ใช้ชั่วคราวเนื่องจาก “การโจมตีที่เป็นอันตรายขนาดใหญ่” ที่มุ่งเป้าไปที่บริการของบริษัท ผู้ใช้เก่ายังสามารถเข้าสู่ระบบได้ตามปกติ

(ตามรายงานของ TechCrunch)