Google DeepMind เพิ่งเปิดตัวก้าวสำคัญอีกครั้งในด้านปัญญาประดิษฐ์เชิงสร้างสรรค์ (GenAI): โมเดลภาพแฟลช Gemini 2.5
โมเดลนี้ซึ่งคนในชุมชนเรียกกันอย่างน่ารักว่า “Nano Banana” เป็นเครื่องมืออันทรงพลังที่สามารถแปลงข้อความเป็นรูปภาพและแก้ไขรูปภาพที่มีอยู่ด้วยความแม่นยำและความยืดหยุ่นสูง
นี่คือภาคต่อของรุ่น Gemini แต่ได้รับการปรับแต่งมาโดยเฉพาะสำหรับงานที่เกี่ยวข้องกับรูปภาพ

ด้วยข้อได้เปรียบที่โดดเด่นในการสร้างและแก้ไขภาพ Nano Banana จึงดึงดูดความสนใจจากผู้ใช้เทคโนโลยีทั่วโลก รวมถึงเวียดนามด้วย
จากข้อมูลของ Google Trends พบว่าการค้นหาคำว่า Gemini และ Nano Banana พุ่งสูงขึ้นอย่างมากในช่วง 24 ชั่วโมงที่ผ่านมา สถิติตั้งแต่วันที่ 4 กันยายนแสดงให้เห็นว่าคีย์เวิร์ด "Gemini" ติดอันดับสูงสุดในชาร์ตเทรนด์ในทุกหัวข้อ
บนฟอรัมและกลุ่มเครือข่ายสังคม ผู้ใช้ยังแบ่งปันและทดสอบคำสั่งและสคริปต์การสร้างภาพโดยใช้ Nano Banana อีกด้วย
คนส่วนใหญ่ชื่นชมความสามารถของเครื่องมือในการสร้างภาพ "อย่างรวดเร็ว เรียบร้อย และฉับไว" เช่นเดียวกับคุณภาพของผลิตภัณฑ์ที่ได้
Gemini 2.5 Flash Image ไม่ได้สร้างแค่ภาพจากคำอธิบายข้อความเท่านั้น แต่ยังโดดเด่นในด้านหลักๆ หลายประการ ได้แก่ การแก้ไขภาพตามต้องการ ความสอดคล้องของอักขระ ความเร็วในการประมวลผลที่น่าประทับใจ และเทคโนโลยีความปลอดภัย SynthID
ผู้ใช้สามารถใช้ภาษาธรรมชาติเพื่อเปลี่ยนแปลงองค์ประกอบต่างๆ ในภาพถ่ายได้ เช่น เพียงพิมพ์คำสั่ง “เพิ่มเก้าอี้สีแดงข้างโต๊ะ” หรือ “เปลี่ยนพื้นหลังเป็นป่า” แล้วโมเดลจะแก้ไขภาพอย่างแม่นยำและราบรื่น
ความสอดคล้องของตัวละครถือเป็นคุณสมบัติที่ล้ำสมัยที่สุด โมเดลสามารถจดจำและสร้างภาพตัวละครหรือวัตถุที่มีลักษณะที่สอดคล้องกัน (เช่น ใบหน้า เสื้อผ้า สไตล์) ซ้ำๆ ได้ในหลายภาพ
สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับโครงการสร้างสรรค์ที่ต้องสร้างภาพชุดที่เกี่ยวข้องกันตั้งแต่การ์ตูนไปจนถึงแคมเปญการตลาด
ด้วยสถาปัตยกรรมที่ได้รับการปรับให้เหมาะสม Gemini 2.5 Flash Image สามารถสร้างผลลัพธ์คุณภาพสูงได้ภายในไม่กี่วินาที ช่วยเร่งความเร็วเวิร์กโฟลว์ด้านความคิดสร้างสรรค์ได้อย่างมาก
รูปภาพทั้งหมดที่สร้างหรือแก้ไขโดยนางแบบจะถูกแท็กด้วยลายน้ำดิจิทัลที่มองไม่เห็นซึ่งเป็นกรรมสิทธิ์ของ Google ซึ่งช่วยให้สามารถจดจำรูปภาพที่สร้างด้วย AI ได้ ช่วยให้มั่นใจได้ถึงความโปร่งใสและแหล่งที่มาของเนื้อหา
โมเดล Gemini 2.5 Flash Image กำลังเปิดศักยภาพการใช้งานที่หลากหลาย ตั้งแต่ผู้ใช้ทั่วไปไปจนถึงนักพัฒนามืออาชีพ
นักพัฒนาสามารถเข้าถึงโมเดลผ่าน Gemini API และ Google AI Studio เพื่อสร้างแอปพลิเคชันของตนเอง ในขณะที่องค์กรต่างๆ สามารถใช้โมเดลบนแพลตฟอร์ม Vertex AI ได้
สำหรับผู้ใช้ทั่วไป โมเดลดังกล่าวจะถูกสร้างขึ้นโดยตรงใน Google Gemini และแอปอื่นๆ ทำให้การสร้างภาพด้วย AI เป็นเครื่องมือที่เข้าถึงได้และใช้งานง่าย
ด้วยคุณสมบัติที่โดดเด่น โดยเฉพาะความสามารถในการรักษาความสม่ำเสมอของตัวละคร คาดว่า Gemini 2.5 Flash Image จะกลายเป็นคู่แข่งที่น่าเกรงขามของซอฟต์แวร์แก้ไขภาพแบบดั้งเดิม เช่น Photoshop โดยเปลี่ยนแปลงวิธีที่ผู้สร้างและผู้ใช้โต้ตอบกับภาพดิจิทัล

ที่มา: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html
การแสดงความคิดเห็น (0)