Google DeepMind เพิ่งเปิดตัวความก้าวหน้าครั้งสำคัญในด้านปัญญาประดิษฐ์เชิงสร้างสรรค์ (GenAI): โมเดลภาพ Flash Gemini 2.5

โมเดลนี้เป็นที่รู้จักกันในชุมชนด้วยชื่อเล่นว่า "นาโน บานาน่า" เป็นเครื่องมือทรงพลังที่สามารถแปลงข้อความให้เป็นรูปภาพ และแก้ไขรูปภาพที่มีอยู่ได้อย่างแม่นยำและยืดหยุ่นสูง

นี่คือรุ่นต่อยอดจากตระกูล Gemini แต่ได้รับการปรับแต่งมาโดยเฉพาะสำหรับงานที่เกี่ยวข้องกับภาพ

c732a0fbdcce57900edf.jpg
คำว่า Gemini ติดอันดับคำค้นหาที่ได้รับความนิยมสูงสุดบน Google Trends ในเวียดนามเมื่อวันที่ 4 กันยายน (ภาพหน้าจอ)

ด้วยความสามารถที่โดดเด่นในการสร้างและแก้ไขภาพ Nano Banana จึงดึงดูดความสนใจอย่างมากจากผู้ใช้เทคโนโลยีทั่วโลก รวมถึงในเวียดนาม

จากข้อมูลของ Google Trends การค้นหาคำว่า Gemini และ Nano Banana พุ่งสูงขึ้นในช่วง 24 ชั่วโมงที่ผ่านมา สถิติจากวันที่ 4 กันยายน แสดงให้เห็นว่าคำว่า "Gemini" ติดอันดับคำค้นหายอดนิยมในทุกหัวข้อ

ในฟอรัมและกลุ่มโซเชียลมีเดีย ผู้ใช้ยังแชร์และทดลองใช้คำสั่งและสถานการณ์การสร้างภาพต่างๆ โดยใช้ Nano Banana อีกด้วย

คนส่วนใหญ่ชื่นชอบความสามารถของเครื่องมือนี้ในการสร้างภาพได้อย่างรวดเร็วและมีประสิทธิภาพ รวมถึงคุณภาพของผลลัพธ์ที่ได้

นอกเหนือจากการสร้างภาพจากคำอธิบายข้อความแล้ว Gemini 2.5 Flash Image ยังโดดเด่นในหลายด้านหลัก ได้แก่ การแก้ไขภาพด้วยคำสั่ง การรักษาความสม่ำเสมอของตัวอักษร ความเร็วในการประมวลผลที่น่าประทับใจ และเทคโนโลยีความปลอดภัย SynthID

ผู้ใช้สามารถใช้ภาษาธรรมชาติในการเปลี่ยนแปลงองค์ประกอบในรูปภาพได้ ตัวอย่างเช่น เพียงแค่ป้อนคำสั่ง "เพิ่มเก้าอี้สีแดงข้างโต๊ะ" หรือ "เปลี่ยนพื้นหลังเป็นป่า" โมเดลก็จะทำการแก้ไขได้อย่างแม่นยำและราบรื่น

การรักษาความสม่ำเสมอของตัวละครถือเป็นคุณสมบัติที่ก้าวล้ำที่สุด โมเดลสามารถจดจำและสร้างภาพของตัวละครหรือวัตถุที่มีลักษณะคงที่ (เช่น ใบหน้า เสื้อผ้า สไตล์) ในภาพต่างๆ ได้หลายภาพ

สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับโครงการสร้างสรรค์ที่ต้องการสร้างชุดภาพที่เกี่ยวข้องกัน ตั้งแต่การ์ตูนไปจนถึงแคมเปญการตลาด

ด้วยสถาปัตยกรรมที่ได้รับการปรับปรุงให้เหมาะสม Gemini 2.5 Flash Image สามารถสร้างผลลัพธ์คุณภาพสูงได้ในเวลาเพียงไม่กี่วินาที ช่วยเร่งกระบวนการสร้างสรรค์ได้อย่างมาก

ภาพทั้งหมดที่สร้างหรือแก้ไขโดยนางแบบจะถูกติดแท็กด้วยลายน้ำดิจิทัลที่มองไม่เห็นซึ่งเป็นกรรมสิทธิ์ของ Google ทำให้สามารถระบุภาพที่สร้างด้วย AI ได้ จึงช่วยให้มั่นใจได้ถึงความโปร่งใสและที่มาของเนื้อหา

โมเดลอิมเมจ Flash Gemini 2.5 เปิดโอกาสในการใช้งานที่หลากหลาย ตั้งแต่ผู้ใช้ทั่วไปจนถึงนักพัฒนาซอฟต์แวร์มืออาชีพ

นักพัฒนาสามารถเข้าถึงโมเดลผ่านทาง Gemini API และ Google AI Studio เพื่อสร้างแอปพลิเคชันของตนเอง ในขณะที่ธุรกิจต่างๆ สามารถใช้โมเดลบนแพลตฟอร์ม Vertex AI ได้

สำหรับผู้ใช้งานทั่วไป โมเดลนี้ถูกรวมเข้ากับ Google Gemini และแอปพลิเคชันอื่นๆ โดยตรง ทำให้การสร้างภาพด้วย AI เป็นเครื่องมือที่เข้าถึงได้ง่ายและใช้งานง่าย

ด้วยคุณสมบัติที่โดดเด่น โดยเฉพาะอย่างยิ่งความสามารถในการรักษาความสม่ำเสมอของตัวอักษร Gemini 2.5 Flash Image คาดว่าจะกลายเป็นคู่แข่งที่น่าเกรงขามของซอฟต์แวร์แก้ไขภาพแบบดั้งเดิมอย่าง Photoshop และเปลี่ยนแปลงวิธีการที่ผู้สร้างและผู้ใช้โต้ตอบกับภาพดิจิทัล

จีนแซงหน้าสหรัฐอเมริกาอย่างไม่คาดคิดในการแข่งขันการแปลภาษาด้วย AI ระดับโลก โมเดลโอเพนซอร์ส Hunyuan-MT-7B ของ Tencent (จีน) คว้าชัยชนะอย่างเด็ดขาดเหนือยักษ์ใหญ่จากอเมริกาในการแข่งขันการแปลภาษาด้วยเครื่องจักรระดับนานาชาติที่จัดขึ้นในงานประชุม WMT25

ที่มา: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html