![]() |
โลโก้ Google Gemini ภาพ: Bloomberg |
Google เปิดตัว Gemini 3 เมื่อปลายเดือนพฤศจิกายนที่ผ่านมา โดยบริษัทได้นำการอัปเกรดที่สำคัญมามากมาย เช่น การปรับปรุงความสามารถในการเขียนโค้ด การแสดงภาพ และเอเจนต์ ซึ่งทำหน้าที่บางอย่างแทนผู้ใช้
เมื่อเปิดตัว Gemini 3 ทาง Google เน้นย้ำว่านี่คือ "โมเดลที่ชาญฉลาดที่สุด" ของบริษัท จากประสบการณ์จริงแสดงให้เห็นว่าโมเดลนี้ประมวลผลได้เร็วขึ้น มีความสามารถในการใช้เหตุผลที่ดีขึ้น แม้ว่าจะมีปัจจัยบางประการที่จำเป็นต้องได้รับการปรับปรุงก็ตาม
สร้างอินเทอร์เฟซแบบโต้ตอบได้อย่างรวดเร็ว
การอัปเกรดครั้งใหญ่ประการหนึ่งใน Gemini 3 เกี่ยวข้องกับ Canvas ซึ่งเป็นพื้นที่ทำงานแบบโต้ตอบใน Gemini ที่ให้คุณขอให้แชทบอทเขียนโค้ด แสดงภาพผลลัพธ์ และแก้ไขเนื้อหา
เมื่อ Gemini 3 ถูกขอให้สร้างแบบจำลอง 3 มิติของความแตกต่างระหว่างขนาดลูกฟุตบอล โลก ดวงอาทิตย์ และทางช้างเผือก เครื่องมือจะทริกเกอร์อินเทอร์เฟซการเข้ารหัส การประมวลผล และการสร้างแบบโต้ตอบที่ให้สามารถเลือกและเปรียบเทียบขนาดของวัตถุได้
![]() |
ความสามารถในการสร้างพื้นที่โต้ตอบด้วยคุณสมบัติ Canvas ใน Gemini 3 |
เมื่อเทียบกับการสาธิตของ Google ผลลัพธ์ที่ได้นั้นด้อยกว่าเล็กน้อยในแง่ของคุณภาพของภาพ ในทางกลับกัน ข้อมูลเกี่ยวกับวัตถุต่างๆ จะแสดงอย่างชัดเจนและเข้าใจง่าย การประมวลผลใช้เวลาประมาณ 2 นาที ในอินเทอร์เฟซ Canvas ผู้ใช้สามารถแก้ไขโค้ด คัดลอก หรือแชร์เนื้อหาได้โดยตรง
ด้วยคำสั่งอื่น Gemini 3 ได้รับมอบหมายให้สร้างนกอินทรีแบบว็อกเซลนั่งอยู่บนกิ่งไม้ เครื่องมือนี้ให้ผลลัพธ์หลังจากผ่านไปประมาณ 45 วินาที และผู้ใช้สามารถซูมเข้าและหมุนมุมมองโดยใช้เมาส์ อย่างไรก็ตาม รายละเอียดบางอย่างในภาพมีข้อผิดพลาดทางกราฟิกและแสดงผลไม่ถูกต้อง
มีรูปนกอินทรีเกาะอยู่บนกิ่งไม้ด้วย แต่คำขอยากกว่า (โมเดล 3 มิติ) ครั้งแรกโค้ดที่สร้างโดย Gemini 3 ขัดข้องและทำงานไม่ได้ หลังจากร้องขอการแก้ไข รูปภาพก็ปรากฏขึ้นและสามารถโต้ตอบได้
![]() |
ความสามารถในการสร้างสภาพแวดล้อมแบบโต้ตอบของ Gemini 3 |
แม้จะมีปัญหาบางประการ แต่การเปลี่ยนจากรูปแบบคำถามและคำตอบไปเป็นการแก้ไขร่วมกันถือเป็นทิศทางที่น่าสนใจที่จะทำให้ Gemini 3 มีประโยชน์สำหรับงานที่ซับซ้อนในระยะยาว
แน่นอนว่า Gemini 3 ไม่ได้มีไว้สำหรับสร้างกราฟิกหรือโมเดลภาพเพียงอย่างเดียว Google กำลังทดสอบฟีเจอร์ "Generative UI" สำหรับผู้ใช้ AI Pro ด้วยคำสั่งเพียงไม่กี่คำ โมเดลก็สามารถสร้างอินเทอร์เฟซแบบนิตยสารอินเทอร์แอคทีฟหรือเว็บไซต์ภาพได้
Google ระบุว่าฟีเจอร์นี้กำลังทยอยเปิดตัวเป็นระยะๆ อย่างที่ The Verge ได้แจ้งไว้ ผู้ใช้ต้องเลือกฟีเจอร์ Visual layout แล้วพิมพ์คำสั่งเช่น "วางแผนทริป 3 วันไปโรมให้ฉัน"
หลังจากประมวลผลแล้ว Gemini 3 จะสร้างผลลัพธ์ที่คล้ายกับเว็บไซต์ ท่องเที่ยว พร้อมตารางการเดินทางและรูปภาพโดยละเอียด พร้อมคำถามมากมายเกี่ยวกับความชอบในการเดินทางและรูปแบบการรับประทานอาหาร จากนั้นโมเดลจะปรับคำตอบให้เหมาะสม ฟีเจอร์นี้ยังมีประโยชน์อย่างมากสำหรับหัวข้อต่างๆ เช่น วิธีประกอบคอมพิวเตอร์ การสร้างตู้ปลา เป็นต้น
เหตุผลและวิเคราะห์ได้อย่างมีประสิทธิภาพมากขึ้น
Google ระบุว่า Gemini 3 มีความสามารถในการใช้เหตุผลที่ดีกว่ารุ่นก่อนหน้า บริษัทอ้างว่า Gemini 3 Pro มีความสามารถในการใช้เหตุผลในระดับปริญญาเอก โดยมีคะแนน 37.5% ในการสอบ Humanity's Last Exam และ 91.9% ในการสอบ GPQA Diamond
แน่นอนว่าผู้ใช้จะรู้สึกถึงความแตกต่างได้ก็ต่อเมื่อได้โต้ตอบกับโมเดลโดยตรงเท่านั้น เมื่อได้รับมอบหมายให้แก้ปัญหาจากชุดอ้างอิง GPQA Diamond (เน้นระดับปริญญาเอก) Gemini 3 Pro ใช้เวลาประมาณ 30 วินาทีในการให้คำตอบโดยละเอียด ซึ่งรวมถึงขั้นตอนของปัญหาแต่ละขั้นตอนและภาพประกอบ
![]() |
ราศีเมถุน 3 สามารถตอบคำถามที่ซับซ้อนได้ มีความสามารถในการคิดเทียบเท่าระดับปริญญาเอก |
จากการประเมิน พบว่าคำตอบค่อนข้างละเอียดและเป็นไปตามขั้นตอน สำหรับการเปรียบเทียบ GPT-5.1 ก็ใช้เวลาประมาณ 30 วินาทีเช่นกัน ตอบถูก แต่คำตอบมีรายละเอียดน้อยกว่า ในทำนองเดียวกัน Claude 4.5 Sonnet ก็ตอบถูก เร็วกว่า Gemini 3 แต่มีรายละเอียดน้อยกว่า
Google ระบุว่า Gemini 3 สามารถดึงเอกสารจากหลายแหล่งพร้อมกันได้ เช่น ข้อความ รูปภาพ และ วิดีโอ งานที่ไม่เคยได้รับการฝึกฝนมาก่อนก็ได้รับการจัดการที่ดีขึ้นบน Gemini 3
![]() |
ความสามารถในการวิเคราะห์วิดีโอของ Gemini 3 |
ตัวอย่างเช่น เมื่อถูกขอให้วิเคราะห์หัวข้อหลักของวิดีโอความยาว 57 นาที Gemini 3 ใช้เวลาเพียงประมาณหนึ่งนาทีในการส่งผลลัพธ์ที่มีอาร์กิวเมนต์ที่ร้องขอ พร้อมประทับเวลาของส่วนที่เกี่ยวข้องของวิดีโอ ในทำนองเดียวกัน โมเดลสามารถระบุวิดีโอเกี่ยวกับเทนนิสได้อย่างถูกต้อง โดยวิเคราะห์การแข่งขันและวิธีการเล่นของผู้เล่นแต่ละคน
ผู้ใช้สามารถขอให้ Gemini 3 ดูวิดีโอขณะอ้างอิงแหล่งข้อมูลภายนอก หรือแม้แต่ถามคำถามเพื่อการวิเคราะห์เชิงลึกยิ่งขึ้น โดยรวมแล้ว Gemini 3 ตอบสนองได้ค่อนข้างดีในการวิเคราะห์และอ้างอิงเอกสาร ซึ่งส่วนหนึ่งต้องขอบคุณการเชื่อมต่อกับฐานข้อมูล Google Search
ตัวแทนช่วยเหลือดีแต่มีปัญหา
Agent ถือเป็นการอัปเกรดที่โดดเด่นบน Gemini 3 สำหรับผู้ใช้แพ็คเกจ AI Ultra (ปัจจุบันรองรับเฉพาะตลาดสหรัฐฯ) โหมดนี้สามารถดำเนินการขั้นตอนที่ซับซ้อนแทนผู้ใช้ เช่น การจัดเรียงและจัดระเบียบอีเมล การค้นหาข้อมูล การจองตั๋วเดินทาง...
เมื่อ Google เปิดตัว Gemini 3 มันแสดงให้เห็นถึงความสามารถในการจัดระเบียบกล่องจดหมายใน Gmail และจากประสบการณ์ของ The Verge มันทำงานได้อย่างที่ควรจะเป็น นั่นคือสร้างรายการอีเมลที่ยังไม่ได้อ่านทั้งหมดจากหนึ่งสัปดาห์
คล้ายกับฟีเจอร์ Canvas รายการอีเมลและการดำเนินการที่แนะนำจะแสดงในพื้นที่แยกต่างหาก Gemini มีตัวเลือกต่างๆ เช่น การตั้งเตือนสำหรับอีเมลสำคัญ การเก็บถาวรอีเมลส่งเสริมการขาย...
![]() |
ฟีเจอร์ตัวแทนของ Gemini 3 รองรับการจัดการกล่องจดหมาย Gmail ภาพ: The Verge |
เมื่อถูกขอให้สร้างการแจ้งเตือนการชำระเงิน Gemini จะดึงข้อมูลที่เกี่ยวข้องเข้าสู่ Google Tasks อย่างรวดเร็ว สำหรับงานการชำระเงิน เจ้าหน้าที่จะนำทางและหยุดโดยอัตโนมัติเมื่อผู้ใช้ต้องป้อนข้อมูลการชำระเงิน
โดยรวมแล้ว ตัวแทน Gemini 3 มีประโยชน์อย่างมากในการตรวจจับอีเมลที่ผู้ใช้อาจลืม นอกจากนี้ เครื่องมือนี้ยังสามารถค้นหาและยกเลิกการสมัครรับอีเมลจากที่อยู่โฆษณาที่ไม่มีประโยชน์อีกต่อไปได้อีกด้วย
อันที่จริงแล้ว ตัวแทนแชทบอทบางตัว เช่น Perplexity และ ChatGPT รองรับการผสานรวม Gmail แล้ว อย่างไรก็ตาม ความสามารถในการผสานรวมของ Gemini มีความหลากหลายมากที่สุด ตัวอย่างเช่น ผู้ใช้ Perplexity ต้องระบุอีเมลที่ต้องการเก็บหรือลบโดยเฉพาะ ในขณะที่ Gemini สามารถทำได้ผ่านปุ่ม
![]() |
ฟีเจอร์สร้างอินเทอร์เฟซแบบโต้ตอบของ Gemini 3 ภาพ: The Verge |
ฟีเจอร์การกำหนดเวลาส่งอีเมลของ ChatGPT ก็ไม่เสถียรเช่นกัน อย่างไรก็ตาม ความเร็วในการส่งอีเมลของ Gemini ช้ากว่าของ Perplexity บางงาน เช่น การจองร้านอาหาร ก็มีปัญหาบ้าง
แม้ว่าระบบจะต้องยืนยันจากผู้ใช้ก่อนดำเนินการสำคัญๆ เช่น การชำระเงินหรือการส่งอีเมล แต่การปล่อยให้ AI ทำงานบางอย่างก็ยังทำให้ผู้ใช้ลังเล โหมดตัวแทนบน Gemini 3 ค่อนข้างมีประโยชน์ แต่ผู้ใช้ยังคงต้องคอยตรวจสอบผลลัพธ์
ที่มา: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















การแสดงความคิดเห็น (0)