گوگل ڈیپ مائنڈ نے ابھی ابھی جنریٹیو آرٹیفیشل انٹیلی جنس (GenAI) کے میدان میں ایک بڑی چھلانگ متعارف کرائی ہے: Gemini 2.5 فلیش امیج ماڈل۔

کمیونٹی کے ذریعہ پیار سے "نانو کیلے" کے نام سے جانا جاتا ہے، یہ ماڈل ایک طاقتور ٹول ہے جو متن کو تصاویر میں تبدیل کرنے اور موجودہ تصاویر کو اعلی درستگی اور لچک کے ساتھ ترمیم کرنے کے قابل ہے۔

یہ جیمنی ماڈل لائن کا جانشین ہے، لیکن خاص طور پر تصویر سے متعلق کاموں کے لیے موزوں ہے۔

c732a0fbdcce57900edf.jpg
کلیدی لفظ Gemini 4 ستمبر کو ویتنام میں Google Trends پر رجحان سازی کی فہرست میں سرفہرست ہے۔ (اسکرین شاٹ)

امیج بنانے اور ایڈیٹنگ میں اپنی شاندار صلاحیتوں کے ساتھ، نینو کیلا ویتنام سمیت دنیا بھر کے ٹیکنالوجی صارفین کی خاصی توجہ مبذول کر رہا ہے۔

گوگل ٹرینڈز کے مطابق گزشتہ 24 گھنٹوں میں جیمنی اور نینو کیلے کی تلاش میں اضافہ ہوا ہے۔ 4 ستمبر کے اعداد و شمار بتاتے ہیں کہ کلیدی لفظ "جیمنی" تمام موضوعات کے رجحان ساز چارٹس میں سرفہرست ہے۔

فورمز اور سوشل میڈیا گروپس پر، صارفین نینو کیلے کا استعمال کرتے ہوئے تصویر بنانے کے کمانڈز اور منظرناموں کا اشتراک اور تجربہ بھی کرتے ہیں۔

زیادہ تر لوگ اس آلے کی تصاویر کو تیزی سے اور مؤثر طریقے سے بنانے کی صلاحیت کے ساتھ ساتھ اس کے آؤٹ پٹ کے معیار کی بھی تعریف کرتے ہیں۔

متن کی تفصیل سے محض تصاویر بنانے کے علاوہ، جیمنی 2.5 فلیش امیج کئی بنیادی شعبوں میں سبقت لے جاتا ہے: کمانڈ پر مبنی امیج ایڈیٹنگ، کردار کی مستقل مزاجی، متاثر کن پروسیسنگ کی رفتار، اور SynthID سیکیورٹی ٹیکنالوجی۔

صارف تصویر میں عناصر کو تبدیل کرنے کے لیے قدرتی زبان استعمال کر سکتے ہیں۔ مثال کے طور پر، "میز کے ساتھ ایک سرخ کرسی شامل کریں" یا "پس منظر کو جنگل میں تبدیل کریں" کے کمانڈ میں داخل ہونے سے ماڈل درست اور بغیر کسی رکاوٹ کے ترمیم کرے گا۔

کردار کی مستقل مزاجی کو برقرار رکھنا سب سے اہم خصوصیت سمجھا جاتا ہے۔ ماڈل متعدد مختلف امیجز میں مستقل خصوصیات (جیسے چہرہ، لباس، انداز) کے ساتھ کسی کردار یا شے کی تصویر کو یاد اور دوبارہ بنا سکتا ہے۔

یہ خاص طور پر تخلیقی منصوبوں کے لیے مفید ہے جن کو کامکس سے لے کر مارکیٹنگ کی مہموں تک متعلقہ تصاویر کی ایک سیریز بنانے کی ضرورت ہے۔

اپنے بہترین فن تعمیر کے ساتھ، جیمنی 2.5 فلیش امیج صرف سیکنڈوں میں اعلیٰ معیار کے نتائج پیدا کر سکتا ہے، تخلیقی عمل کو نمایاں طور پر تیز کرتا ہے۔

ماڈل کی طرف سے تخلیق یا ترمیم کی گئی تمام تصاویر کو گوگل کے ملکیتی غیر مرئی ڈیجیٹل واٹر مارک کے ساتھ ٹیگ کیا جاتا ہے، جس سے AI کے ساتھ بنائی گئی تصاویر کی شناخت ہوتی ہے، اس طرح مواد کی شفافیت اور اصلیت کو یقینی بنانے میں مدد ملتی ہے۔

جیمنی 2.5 فلیش امیج ماڈل انفرادی صارفین سے لے کر پیشہ ور ڈویلپرز تک بہت سے ممکنہ ایپلی کیشنز کو کھول رہا ہے۔

ڈویلپرز اپنی ایپلی کیشنز بنانے کے لیے Gemini API اور Google AI سٹوڈیو کے ذریعے ماڈل تک رسائی حاصل کر سکتے ہیں، جبکہ کاروبار اس ماڈل کو Vertex AI پلیٹ فارم پر استعمال کر سکتے ہیں۔

اوسط صارف کے لیے، اس ماڈل کو براہ راست گوگل جیمنی اور دیگر ایپلی کیشنز میں ضم کیا گیا ہے، جس سے AI امیج کی تخلیق ایک قابل رسائی اور بدیہی ٹول ہے۔

اپنی نمایاں خصوصیات کے ساتھ، خاص طور پر کردار کی مستقل مزاجی کو برقرار رکھنے کی صلاحیت کے ساتھ، جیمنی 2.5 فلیش امیج سے فوٹو شاپ جیسے روایتی فوٹو ایڈیٹنگ سافٹ ویئر کا ایک زبردست حریف بننے کی امید ہے، جس سے تخلیق کاروں اور صارفین کے ڈیجیٹل امیجز کے ساتھ تعامل کا طریقہ بدل جائے گا۔

چین نے AI ترجمہ کے عالمی مقابلے میں غیر متوقع طور پر امریکہ کو پیچھے چھوڑ دیا ۔ Tencent کے (چین) اوپن سورس ماڈل Hunyuan-MT-7B نے WMT25 کانفرنس میں منعقدہ بین الاقوامی مشینی ترجمہ مقابلے میں امریکی جنات پر تقریباً مکمل فتح حاصل کی۔

ماخذ: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html