گوگل ڈیپ مائنڈ نے جنریٹیو آرٹیفیشل انٹیلی جنس (GenAI): جیمنی 2.5 فلیش امیج ماڈل کے میدان میں ایک اہم قدم آگے بڑھایا ہے۔

کمیونٹی کی طرف سے پیار سے "نانو کیلے" کے نام سے جانا جاتا ہے، یہ ماڈل ایک طاقتور ٹول ہے، جو متن کو تصاویر میں تبدیل کرنے اور موجودہ تصاویر میں بڑی درستگی اور لچک کے ساتھ ترمیم کرنے کی صلاحیت رکھتا ہے۔

یہ جیمنی ماڈل لائن کا تسلسل ہے، لیکن خاص طور پر تصویر سے متعلق کاموں کے لیے بہتر بنایا گیا ہے۔

c732a0fbdcce57900edf.jpg
کلیدی لفظ Gemini 4 ستمبر کو ویتنام میں Google Trends پر رجحان سازی کی فہرست میں سرفہرست ہے۔ اسکرین شاٹ۔

تصویر بنانے اور ایڈیٹنگ کی صلاحیتوں میں شاندار فوائد کے ساتھ، نینو کیلا ویتنام سمیت عالمی ٹیکنالوجی صارفین کی توجہ اپنی طرف مبذول کر رہا ہے۔

گوگل ٹرینڈز کے مطابق گزشتہ 24 گھنٹوں میں جیمنی اور نینو کیلے کی تلاش میں اضافہ ہوا ہے۔ 4 ستمبر کے اعداد و شمار بتاتے ہیں کہ کلیدی لفظ "جیمنی" تمام موضوعات کے رجحان ساز چارٹ میں سرفہرست ہے۔

فورمز اور سوشل نیٹ ورکنگ گروپس پر، صارفین نینو کیلے کا استعمال کرتے ہوئے تصویر بنانے کے کمانڈز اور اسکرپٹس کا اشتراک اور جانچ بھی کرتے ہیں۔

ان میں سے اکثر "تیز، صاف اور چست" تصاویر بنانے کی صلاحیت کے ساتھ ساتھ ٹول کے آؤٹ پٹ پروڈکٹ کے معیار کی بھی بہت تعریف کرتے ہیں۔

متن کی وضاحت سے تصاویر بنانے سے زیادہ، جیمنی 2.5 فلیش امیج کئی بنیادی پہلوؤں میں بہترین ہے: آن ڈیمانڈ امیج ایڈیٹنگ، کردار کی مستقل مزاجی، متاثر کن پروسیسنگ کی رفتار، اور SynthID سیکیورٹی ٹیکنالوجی۔

صارف تصویر میں عناصر کو تبدیل کرنے کے لیے قدرتی زبان استعمال کر سکتے ہیں۔ مثال کے طور پر، صرف کمانڈ میں ٹائپ کریں "ٹیبل کے ساتھ ایک سرخ کرسی شامل کریں" یا "پس منظر کو جنگل میں تبدیل کریں" اور ماڈل درست اور بغیر کسی رکاوٹ کے ترمیم کرے گا۔

کردار کی مستقل مزاجی کو سب سے اہم خصوصیت سمجھا جاتا ہے۔ ماڈل متعدد مختلف تصاویر میں مستقل خصوصیات (جیسے چہرہ، کپڑے، انداز) کے ساتھ کسی کردار یا شے کی تصویر کو حفظ اور دوبارہ بنا سکتا ہے۔

یہ خاص طور پر ان تخلیقی منصوبوں کے لیے مفید ہے جن کے لیے کامکس سے لے کر مارکیٹنگ مہم تک متعلقہ تصاویر کی ایک سیریز بنانے کی ضرورت ہوتی ہے۔

اپنے بہترین فن تعمیر کے ساتھ، Gemini 2.5 Flash Image سیکنڈوں میں اعلیٰ معیار کے نتائج پیدا کر سکتا ہے، تخلیقی کام کے فلو کو نمایاں طور پر تیز کرتا ہے۔

ماڈل کی طرف سے تخلیق یا ترمیم کی گئی تمام تصاویر کو Google کی جانب سے ملکیتی غیر مرئی ڈیجیٹل واٹر مارک کے ساتھ ٹیگ کیا جاتا ہے، جس سے AI سے تیار کردہ تصاویر کی شناخت ہوتی ہے، مواد کی شفافیت اور اصلیت کو یقینی بنانے میں مدد ملتی ہے۔

جیمنی 2.5 فلیش امیج ماڈل انفرادی صارفین سے لے کر پیشہ ور ڈویلپرز تک ایپلیکیشن کی ایک وسیع رینج کو کھول رہا ہے۔

ڈویلپرز اپنی ایپلی کیشنز بنانے کے لیے Gemini API اور Google AI سٹوڈیو کے ذریعے ماڈل تک رسائی حاصل کر سکتے ہیں، جبکہ کاروبار اس ماڈل کو Vertex AI پلیٹ فارم پر استعمال کر سکتے ہیں۔

اوسط صارف کے لیے، ماڈل کو براہ راست گوگل جیمنی اور دیگر ایپس میں بنایا گیا ہے، جس سے AI امیجنگ ایک قابل رسائی اور بدیہی ٹول ہے۔

اپنی نمایاں خصوصیات کے ساتھ، خاص طور پر کردار کی مستقل مزاجی کو برقرار رکھنے کی صلاحیت کے ساتھ، جیمنی 2.5 فلیش امیج سے توقع کی جاتی ہے کہ وہ فوٹو شاپ جیسے روایتی فوٹو ایڈیٹنگ سافٹ ویئر کا ایک مضبوط حریف بن جائے گا، جس سے تخلیق کاروں اور صارفین کے ڈیجیٹل امیجز کے ساتھ تعامل کا طریقہ بدل جائے گا۔

چین نے AI ترجمہ کے عالمی مقابلے میں غیر متوقع طور پر امریکہ کو پیچھے چھوڑ دیا ۔ Tencent کے اوپن سورس Hunyuan-MT-7B ماڈل (چین) نے ڈبلیو ایم ٹی 25 کانفرنس کے فریم ورک کے اندر بین الاقوامی مشینی ترجمہ مقابلے میں تقریباً مکمل طور پر امریکی 'جائنٹس' پر جیت لیا۔

ماخذ: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html