คู่แข่งรายใหญ่ที่สุดของ ChatGPT

โลโก้ Google Gemini ภาพ: Bloomberg

Google เปิดตัวสมาร์ทโฟนรุ่น Gemini 3 ในช่วงปลายเดือนพฤศจิกายน บริษัทได้แนะนำการอัปเกรดที่โดดเด่นหลายอย่าง เช่น ความสามารถในการเขียนโค้ดที่ดีขึ้น การสร้างภาพแบบวิชวล และเอเจนต์ที่ทำงานบางอย่างแทนผู้ใช้

เมื่อเปิดตัว Gemini 3 กูเกิลเน้นย้ำว่านี่คือ "โมเดลที่ฉลาดที่สุดเท่าที่บริษัทเคยสร้างมา" ประสบการณ์ในโลกแห่งความเป็นจริงแสดงให้เห็นว่าโมเดลนี้ประมวลผลได้เร็วขึ้นและมีความสามารถในการให้เหตุผลที่ดีขึ้น แม้ว่าจะยังมีบางส่วนที่ต้องปรับปรุงอยู่บ้างก็ตาม

สร้างอินเทอร์เฟซแบบโต้ตอบได้อย่างรวดเร็ว

หนึ่งในฟีเจอร์ที่ได้รับการอัปเกรดอย่างมากใน Gemini 3 คือ Canvas ซึ่งเป็นพื้นที่ทำงานแบบโต้ตอบภายใน Gemini ที่ช่วยให้คุณสามารถสั่งให้แชทบอทเขียนโค้ด แสดงผลลัพธ์ และแก้ไขเนื้อหาได้

เมื่อ Gemini 3 ได้รับคำสั่งให้สร้างแบบจำลอง 3 มิติแสดงความแตกต่างของขนาดระหว่างลูกฟุตบอล โลก ดวงอาทิตย์ และกาแล็กซีทางช้างเผือก เครื่องมือจะเปิดใช้งานอินเทอร์เฟซการเขียนโค้ด ประมวลผล และสร้างสภาพแวดล้อมแบบโต้ตอบ ทำให้ผู้ใช้สามารถเลือกและเปรียบเทียบขนาดของวัตถุได้

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

ความสามารถในการสร้างพื้นที่แบบโต้ตอบโดยใช้คุณสมบัติ Canvas ใน Gemini 3

เมื่อเทียบกับเดโมของ Google ผลลัพธ์ที่ได้มีคุณภาพของภาพด้อยกว่าเล็กน้อย อย่างไรก็ตาม ข้อมูลเกี่ยวกับวัตถุนั้นชัดเจนและเข้าใจง่าย เวลาในการประมวลผลประมาณ 2 นาที ในอินเทอร์เฟซ Canvas ผู้ใช้สามารถแก้ไขโค้ด คัดลอก หรือแชร์เนื้อหาได้โดยตรง

ด้วยคำสั่งอีกคำสั่งหนึ่ง Gemini 3 ถูกขอให้สร้างแบบจำลองสามมิติแบบลูกบาศก์ (voxel) ของนกอินทรีที่เกาะอยู่บนกิ่งไม้ เครื่องมือนี้สร้างผลลัพธ์ได้ในเวลาประมาณ 45 วินาที และผู้ใช้สามารถซูมเข้าและหมุนมุมมองได้โดยใช้เมาส์ อย่างไรก็ตาม รายละเอียดบางส่วนในภาพมีข้อผิดพลาดทางกราฟิกและแสดงผลไม่เสถียร

นกอินทรีที่เกาะอยู่บนกิ่งไม้ก็มีอยู่ด้วย แต่ข้อกำหนดนั้นยากกว่า (เป็นโมเดล 3 มิติ) ในตอนแรก โค้ดที่สร้างโดย Gemini 3 ล้มเหลวและไม่สามารถทำงานได้ หลังจากขอแก้ไขแล้ว ภาพก็ปรากฏขึ้นและสามารถโต้ตอบได้

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

ความสามารถของ Gemini 3 ในการสร้างสภาพแวดล้อมแบบโต้ตอบได้

แม้จะมีปัญหาบางประการที่ยังคงอยู่ การเปลี่ยนจากรูปแบบถามตอบไปสู่แนวทางการทำงานร่วมกันและการแก้ไขนั้นเป็นทิศทางที่น่าสนใจ ทำให้ Gemini 3 มีประโยชน์สำหรับงานที่ซับซ้อนและระยะยาว

แน่นอนว่า Gemini 3 ไม่ได้มีไว้สำหรับสร้างกราฟิกหรือโมเดลภาพเพียงอย่างเดียว Google กำลังทดสอบฟีเจอร์ "Generative UI" สำหรับผู้ใช้ AI Pro โดยโมเดลสามารถสร้างอินเทอร์เฟซแบบโต้ตอบสไตล์นิตยสารหรือเว็บไซต์ภาพได้ด้วยคำสั่งบางอย่าง

Google ระบุว่าฟีเจอร์นี้กำลังทยอยเปิดใช้งานเป็นระยะ ตามประสบการณ์ของ The Verge ผู้ใช้ต้องเลือกฟีเจอร์ Visual Layout จากนั้นป้อนคำสั่ง เช่น "วางแผนการเดินทาง 3 วันไปโรม"

หลังจากประมวลผลแล้ว Gemini 3 จะสร้างผลลัพธ์ที่คล้ายกับเว็บไซต์ ท่องเที่ยว โดยมีรายละเอียดการเดินทาง รูปภาพโดยละเอียด และคำถามเกี่ยวกับความชอบในการเดินทางและพฤติกรรมการรับประทานอาหาร จากนั้นแบบจำลองจะปรับคำตอบให้เหมาะสม คุณสมบัตินี้ยังมีประโยชน์มากสำหรับหัวข้อต่างๆ เช่น วิธีประกอบคอมพิวเตอร์หรือวิธีสร้างตู้ปลา

การให้เหตุผลและการวิเคราะห์ที่มีประสิทธิภาพมากขึ้น

จากข้อมูลของ Google Gemini 3 มีประสิทธิภาพด้านการให้เหตุผลดีกว่ารุ่นก่อนหน้า บริษัทอ้างว่าความสามารถในการให้เหตุผลของ Gemini 3 Pro อยู่ในระดับปริญญาเอก โดยทำคะแนนได้ 37.5% ในการสอบ Humanity's Last Exam และ 91.9% ในการสอบ GPQA Diamond

แน่นอนว่า ผู้ใช้จะเห็นความแตกต่างอย่างแท้จริงก็ต่อเมื่อได้ลองใช้งานกับโมเดลโดยตรงเท่านั้น เมื่อได้รับโจทย์จากชุดคำถามอ้างอิง GPQA Diamond (ซึ่งเน้นระดับปริญญาเอก) Gemini 3 Pro ใช้เวลาประมาณ 30 วินาทีในการให้คำตอบโดยละเอียด รวมถึงคำแนะนำทีละขั้นตอนและภาพประกอบ

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

ผู้ที่เกิดภายใต้ราศีเมถุนหมายเลข 3 สามารถตอบคำถามที่ซับซ้อนได้ แสดงให้เห็นถึงความสามารถในการคิดเทียบเท่าระดับปริญญาเอก

จากการประเมินพบว่าคำตอบค่อนข้างละเอียดและทำตามขั้นตอนที่ถูกต้อง เมื่อเปรียบเทียบกันแล้ว GPT-5.1 ก็ใช้เวลาประมาณ 30 วินาทีในการตอบอย่างถูกต้องเช่นกัน แต่คำตอบนั้นละเอียดน้อยกว่า ในทำนองเดียวกัน Claude 4.5 Sonnet ตอบได้อย่างถูกต้องและเร็วกว่า Gemini 3 แต่มีรายละเอียดน้อยกว่า

Google ระบุว่า Gemini 3 สามารถแยกเอกสารจากหลายแหล่งพร้อมกันได้ เช่น ข้อความ รูปภาพ และ วิดีโอ นอกจากนี้ Gemini 3 ยังสามารถจัดการกับงานที่ไม่เคยได้รับการฝึกฝนมาก่อนได้ดีขึ้นด้วย

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

ความสามารถในการวิเคราะห์วิดีโอของ Gemini 3

ตัวอย่างเช่น เมื่อถูกขอให้วิเคราะห์หัวข้อหลักของวิดีโอความยาว 57 นาที Gemini 3 ใช้เวลาเพียงประมาณหนึ่งนาทีในการแสดงผลลัพธ์ รวมถึงข้อโต้แย้งและช่วงเวลาที่เกี่ยวข้องในส่วนต่างๆ ของวิดีโอ ในทำนองเดียวกัน โมเดลนี้สามารถระบุวิดีโอเทนนิสได้อย่างถูกต้อง โดยวิเคราะห์การแข่งขันและสไตล์การเล่นของนักกีฬาแต่ละคน

ผู้ใช้สามารถสั่งให้ Gemini 3 ดูวิดีโอและอ้างอิงแหล่งข้อมูลภายนอกไปพร้อมๆ กันได้ รวมถึงตั้งคำถามเพื่อการวิเคราะห์เชิงลึกยิ่งขึ้น โดยรวมแล้ว Gemini 3 ตอบสนองได้ค่อนข้างดีในงานวิเคราะห์และการอ้างอิงเอกสาร ซึ่งส่วนหนึ่งเป็นเพราะการเชื่อมต่อกับฐานข้อมูลการค้นหาของ Google

เจ้าหน้าที่ให้ความช่วยเหลือดี แต่ก็ยังมีปัญหาอยู่บ้าง

ฟีเจอร์ Agent ก็เป็นอีกหนึ่งการอัปเกรดที่น่าสนใจใน Gemini 3 สำหรับผู้ใช้แพ็กเกจ AI Ultra (ปัจจุบันมีให้บริการเฉพาะในตลาดสหรัฐอเมริกา) โหมดนี้สามารถทำงานที่ซับซ้อนแทนผู้ใช้ได้ เช่น การจัดหมวดหมู่และจัดระเบียบอีเมล การค้นหาข้อมูล และการจองตั๋วเดินทาง

เมื่อเปิดตัว Gemini 3 Google ได้ยกตัวอย่างความสามารถในการจัดระเบียบกล่องจดหมายเข้าใน Gmail จากประสบการณ์ของ The Verge ฟีเจอร์นี้ทำงานได้ตรงตามที่ร้องขอทุกประการ นั่นคือการสร้างรายการอีเมลที่ยังไม่ได้อ่านทั้งหมดสำหรับหนึ่งสัปดาห์

เช่นเดียวกับฟีเจอร์ Canvas รายชื่ออีเมลและคำแนะนำในการดำเนินการจะแสดงในพื้นที่แยกต่างหาก Gemini มีตัวเลือกมากมาย เช่น การตั้งเตือนสำหรับอีเมลสำคัญ การเก็บถาวรอีเมลส่งเสริมการขาย เป็นต้น

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

ฟีเจอร์เอเจนต์ของ Gemini 3 ช่วยจัดการกล่องจดหมาย Gmail ภาพ: The Verge

เมื่อได้รับคำสั่งให้สร้างการแจ้งเตือนการชำระเงิน Gemini จะป้อนข้อมูลที่เกี่ยวข้องลงใน Google Tasks อย่างรวดเร็ว สำหรับงานชำระเงิน ตัวแทนจะนำทางไปยังส่วนต่างๆ โดยอัตโนมัติและหยุดเมื่อต้องการให้ผู้ใช้ป้อนข้อมูลการชำระเงิน

โดยรวมแล้ว โปรแกรมตรวจจับอีเมลของ Gemini 3 มีประโยชน์มากในการตรวจจับอีเมลที่ผู้ใช้มักลืม นอกจากนี้ เครื่องมือนี้ยังสามารถค้นหาและยกเลิกการสมัครรับอีเมลจากที่อยู่อีเมลโฆษณาที่ไม่มีประโยชน์อีกต่อไปได้อีกด้วย

ที่จริงแล้ว ตัวแทนของแชทบอทบางตัว เช่น Perplexity และ ChatGPT รองรับการทำงานร่วมกับ Gmail อยู่แล้ว อย่างไรก็ตาม Gemini มีความสามารถในการทำงานร่วมกันที่หลากหลายที่สุด ตัวอย่างเช่น ผู้ใช้ Perplexity ต้องป้อนอีเมลที่ต้องการเก็บหรือลบด้วยตนเอง ในขณะที่ใน Gemini สามารถทำได้ผ่านปุ่มต่างๆ

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

ฟีเจอร์การสร้างอินเทอร์เฟซแบบโต้ตอบของ Gemini 3 ภาพ: The Verge

ฟีเจอร์การจัดเรียงอีเมลใน ChatGPT ก็ไม่เสถียรเช่นกัน อย่างไรก็ตาม ความเร็วในการส่งอีเมลของ Gemini ช้ากว่า Perplexity และบางงาน เช่น การจองร้านอาหาร อาจพบปัญหาบ้างเป็นบางครั้ง

แม้ว่าจะต้องได้รับการยืนยันจากผู้ใช้ก่อนดำเนินการใดๆ ที่ละเอียดอ่อน เช่น การชำระเงินหรือการส่งอีเมล แต่การมอบหมายงานบางอย่างให้ AI ทำก็ยังทำให้ผู้ใช้ลังเลอยู่ โหมดเอเจนต์ใน Gemini 3 มีประโยชน์มาก แต่ผู้ใช้ยังคงต้องตรวจสอบผลลัพธ์อยู่ดี

ที่มา: https://znews.vn/gemini-3-tot-den-dau-post1607493.html