AI สร้างภาพของ Google แก้ไขปัญหาที่ยากได้

โมเดล Nano Banana Pro ของ Google รองรับการสร้างอินโฟกราฟิก สไลด์การนำเสนอ และการแก้ไขภาพอย่างชาญฉลาดยิ่งขึ้น โดยเฉพาะอย่างยิ่งไม่มีข้อผิดพลาดกับข้อความอีกต่อไป

Báo Khoa học và Đời sống•28/11/2025

Google เพิ่งเปิดตัว Nano Banana Pro โมเดลสร้างและตกแต่งภาพรุ่นล่าสุด ซึ่งเป็นโมเดล AI ตัวใหม่ที่บริษัทเปิดตัวในสัปดาห์นี้ต่อจาก Gemini 3 Nano Banana Pro พัฒนาบน Gemini 3 Pro โดย Google ย้ำว่านี่คือ “โมเดลตกแต่งภาพที่ล้ำหน้าที่สุด” ที่บริษัทเคยเปิดตัวมา การพัฒนาของโมเดลนี้มุ่งเน้นไปที่การตกแต่งภาพ การสร้างตัวอักษรที่อ่านง่าย และการรักษาความสม่ำเสมอในการออกแบบ

ผู้ใช้สามารถทดลองใช้ Nano Banana Pro ได้ในแอป Gemini (เลือกฟังก์ชัน Create Image > Brainstorm ) บัญชีฟรีสามารถใช้โมเดลได้ในจำนวนครั้งที่จำกัด จากนั้นจึงสลับกลับไปใช้เวอร์ชันเก่า

แอปจดบันทึก NotebookLM จะบูรณาการ Nano Banana Pro ร่วมกับผลิตภัณฑ์สำหรับนักพัฒนา องค์กร และผู้สร้างเนื้อหาของ Google อีกด้วย

ในสหรัฐอเมริกา ผู้ใช้ AI Pro และ AI Ultra สามารถใช้งาน Nano Banana Pro ได้ในโหมด Google Search AI นอกจากนี้ โมเดลใหม่นี้ยังผสานรวมเข้ากับแอปออกแบบยอดนิยมมากมาย เช่น Canva, Figma และ Photoshop

Google ระบุว่าด้วยความสามารถในการใช้เหตุผลขั้นสูงของ Gemini 3 Nano Banana Pro รองรับการสร้างภาพประกอบที่มีเนื้อหาภาพและแบบอักษรที่อ่านง่ายขึ้น ตัวอย่างเช่น เทคโนโลยีนี้สามารถเปลี่ยนข้อความสูตรอาหารเป็นแผนภูมิภาพประกอบ หรือแสดงข้อมูลแบบเรียลไทม์ เช่น สภาพอากาศหรือ กีฬา

การสร้างข้อความเป็นหนึ่งในการปรับปรุงที่ Google ให้ความสำคัญใน Nano Banana Pro เมื่อเทียบกับเวอร์ชันก่อนหน้า รุ่นนี้สามารถสร้างข้อความที่แม่นยำและอ่านง่าย รองรับการแปลเป็นหลายภาษา ผู้ใช้ยังสามารถสร้างข้อความที่มีเอฟเฟกต์พิเศษและเลย์เอาต์ ซึ่งเหมาะสำหรับใช้ในการออกแบบบทความและโปสเตอร์โฆษณา

Nano Banana Pro ยังช่วยปรับปรุงความสม่ำเสมอของการออกแบบอีกด้วย Google ระบุว่าผู้ใช้สามารถใส่รูปภาพได้สูงสุด 14 รูป และให้นางแบบจัดเรียงรูปภาพตามต้องการ โดยยังคงคุณสมบัติต่างๆ ของรูปภาพไว้ได้สูงสุด 5 รูป เครื่องมือนี้ยังคงรักษารูปลักษณ์และความรู้สึกของเพื่อน ครอบครัว และสัตว์เลี้ยงไว้ได้ ไม่ว่าจะทรงผมหรือชุดแบบไหนก็ตาม

ผู้ใช้สามารถขอแก้ไขรายละเอียดในภาพที่มีอยู่ เปลี่ยนมุมถ่ายภาพ อัตราส่วน การปรับสี ตำแหน่งโฟกัส และแม้กระทั่งแสง เหมือนกับการถ่ายภาพโดยตรงด้วยกล้อง

Google ย้ำว่ารูปภาพที่สร้างโดย Nano Banana จะถูกแท็กด้วย SynthID ที่ซ่อนอยู่เพื่อระบุเนื้อหา AI ในเวอร์ชันใหม่ Gemini อนุญาตให้อัปโหลดรูปภาพและถามว่ารูปภาพนั้นสร้างขึ้นโดย Google AI หรือไม่ บริษัทมีแผนที่จะขยายฟีเจอร์นี้ไปยังเสียงและ วิดีโอ ในอนาคต นอกจาก SynthID แล้ว รูปภาพที่สร้างโดยโมเดลของ Google จะยังคงมีลายน้ำเมื่อใช้แผนบริการฟรีหรือ Google AI Pro โดยลายน้ำจะถูกลบออกสำหรับสมาชิก AI Ultra

นับตั้งแต่เปิดตัวในเดือนสิงหาคม Nano Banana ได้รับความสนใจอย่างมากในด้านความสามารถในการสร้างภาพสัตว์เลี้ยง ผู้คน และทิวทัศน์ที่สมจริงอย่างยิ่ง จอช วูดเวิร์ด รองประธานฝ่าย Google Labs และ Gemini กล่าวว่าในเดือนกันยายน Nano Banana ช่วยให้แอป Gemini ดึงดูดผู้ใช้ใหม่ได้ถึง 13 ล้านคนภายในเวลาเพียงสี่วัน วูดเวิร์ดกล่าวว่า Nano Banana Pro มีประสิทธิภาพมากกว่าเวอร์ชันเดิม โดยเน้นที่ฟีเจอร์ต่างๆ เช่น การสร้างอินโฟกราฟิก สไลด์นำเสนอ และการสร้างความสอดคล้องระหว่างภาพ

Google กำลังมองหาข้อได้เปรียบเหนือ OpenAI ในการแข่งขันด้าน AI เชิงสร้างสรรค์ ซึ่งเติบโตอย่างก้าวกระโดดนับตั้งแต่ ChatGPT เปิดตัวในปี 2022 สัปดาห์ที่แล้ว OpenAI ได้ประกาศเปิดตัวเวอร์ชัน GPT-5.1 ซึ่งมุ่งเน้นการปรับปรุงการโต้ตอบของผู้ใช้ ปัจจุบัน ChatGPT เป็นแอปฟรีอันดับหนึ่งบน App Store ของสหรัฐอเมริกา ขณะที่ Gemini อยู่ในอันดับ 2

เมื่อ Gemini 3 เปิดตัว Google ได้ประกาศว่าแอป Gemini มีผู้ใช้รายเดือนมากกว่า 650 ล้านคน และ AI Overviews มีผู้ใช้รายเดือน 2 พันล้านคน ในเดือนตุลาคม Sam Altman ซีอีโอของ OpenAI กล่าวว่า ChatGPT มีผู้ใช้รายสัปดาห์ถึง 800 ล้านคน หลายคนที่สมัครใช้ Gemini วางแผนที่จะเพิ่มขีดจำกัดการใช้งานโมเดลขั้นสูง