گوگل جیمنی اپ گریڈ میں گوگل ڈیپ مائنڈ کے تیار کردہ "نینو کیلے" تصویری ماڈل کا استعمال کیا گیا ہے۔ یہ فیچر اب مفت اور معاوضہ صارفین دونوں کے لیے عالمی سطح پر دستیاب ہے۔ اس کی سب سے بڑی طاقت چہروں اور اشیاء کو تصاویر میں مستقل رکھنے کی صلاحیت ہے، جس کے ساتھ دیگر AI ٹولز اکثر جدوجہد کرتے ہیں۔
ڈیپ مائنڈ میں پروڈکٹ لیڈ، نیکول بریکٹووا نے کہا، "ہم نے واقعی تصاویر کے معیار اور ماڈل کی ہدایات پر عمل کرنے کی صلاحیت کو آگے بڑھایا ہے۔" "یہ اپ ڈیٹ ترامیم کو مزید ہموار بناتا ہے اور نتائج کسی بھی مقصد کے لیے استعمال کیے جانے کے لیے کافی اچھے ہیں۔"
ہر تصویر میں "آپ" کو رکھیں
ان چیزوں میں سے ایک جو AI تصاویر کو جعلی لگتی ہے وہ یہ ہے کہ چھوٹی تفصیلات مسخ ہوجاتی ہیں۔ گوگل کا کہنا ہے کہ جیمنی اس مسئلے کو حل کرتا ہے، جس سے آپ چہرے اور تاثرات کو یکساں رکھتے ہوئے پورا منظر بدل سکتے ہیں۔ آپ تصویر کو بگاڑنے کی فکر کیے بغیر ایک نیا ہیئر اسٹائل آزما سکتے ہیں، دیوار کا رنگ تبدیل کر سکتے ہیں یا کسی پالتو جانور کو منظر میں لا سکتے ہیں۔

جیمنی آپ کو ایک میں جمع کرنے کے لیے متعدد تصاویر اپ لوڈ کرنے کی بھی اجازت دیتا ہے، جیسے کہ آپ دونوں کی سڑک پر ایک ساتھ سوار ہونے کی تصویر بنانے کے لیے اپنی بلی کے ساتھ پورٹریٹ کو جوڑنا۔
جیمنی ملٹی ٹرن ایڈیٹنگ کو سپورٹ کرتا ہے، جس سے صارفین کو جگہ میں ہر تفصیل شامل کرنے کی اجازت ملتی ہے: وال پیپر، فرنیچر سے لے کر پینٹ رنگ تک۔ پلس پوائنٹ یہ ہے کہ صرف وہی حصہ تبدیل ہوتا ہے جس میں ترمیم کی ضرورت ہوتی ہے، باقی وہی رہتا ہے۔
مزید برآں، جیمنی تصاویر کے درمیان سٹائل کو ملا سکتا ہے۔ مثال کے طور پر، بارش کے جوتے کو پھولوں کے پرنٹ کے جوتوں میں تبدیل کریں، یا تتلی کے طرز کا لباس بنائیں۔
ٹیکنالوجی جنات کے درمیان AI امیج بنانے کی دوڑ
گوگل کا اپ گریڈ اس وقت آتا ہے جب AI امیجنگ کی جنگیں گرم ہوتی ہیں۔ OpenAI نے پہلے GPT-4o لانچ کیا، جو براہ راست تصاویر بنا سکتا ہے، اور سٹوڈیو Ghibli طرز کے memes کی ایک سیریز کے ساتھ وائرل ہوا۔ سی ای او سیم آلٹ مین نے انکشاف کیا کہ صارفین کی تعداد میں اتنا اضافہ ہوا کہ کمپنی کے جی پی یوز "تقریباً پگھل گئے۔"
جاری رکھنے کے لیے، Meta نے Midjourney کے ساتھ شراکت داری کا اعلان کیا، جبکہ جرمن سٹارٹ اپ Black Forest Labs اپنے FLUX ماڈل کے ساتھ کئی چارٹس پر حاوی ہے۔

گوگل کو امید ہے کہ جیمنی ChatGPT کے ساتھ خلا کو ختم کر سکتا ہے۔ جیمنی کے اس وقت 450 ملین ماہانہ صارفین ہیں، سی ای او سندر پچائی کے مطابق، ChatGPT سے بہت پیچھے، جس کے ہفتہ وار 700 ملین سے زیادہ صارفین ہیں۔
بریکٹووا نے کہا کہ جیمنی کو حقیقی دنیا کے منظرناموں کے لیے ڈیزائن کیا گیا ہے، رہنے والے کمروں اور باغات کو دیکھنے سے لے کر دل لگی تصاویر بنانے تک۔ ماڈل میں بہتر " عالمی علم" ہے اور یہ متعدد تصاویر اور رنگ پیلیٹ کو ایک ہی رینڈرنگ میں یکجا کر سکتا ہے۔
تاہم، گوگل سخت حدود بھی عائد کرتا ہے۔ تمام تیار کردہ تصاویر میں واضح واٹر مارک اور میٹا ڈیٹا میں ایک شناختی نشان چھپا ہوا ہے۔ کمپنی ڈیپ فیک غلط استعمال کو روکنے کے لیے بغیر اجازت کے حساس تصاویر بنانے پر سختی سے پابندی لگاتی ہے۔
گوگل اس سے قبل جیمنی کی غلط تاریخی تصویروں کے لیے معذرت کر چکا ہے۔ اس بار، کمپنی کا خیال ہے کہ اس نے تخلیقی صلاحیتوں اور حفاظت کے درمیان توازن قائم کیا ہے۔ "ہم چاہتے ہیں کہ صارفین تخلیقی ہوں، لیکن ہر چیز کی اجازت نہیں ہے،" بریکٹووا نے زور دیا۔
جیمنی 2.5 فلیش امیج کے ساتھ، گوگل AI فوٹو ایڈیٹنگ کے تجربے کو بلند کرنے پر شرط لگا رہا ہے، امید ہے کہ وہ پرانے صارفین کو برقرار رکھے گا اور OpenAI، Meta اور دیگر حریفوں کے ساتھ ایک زبردست ٹیکنالوجی کی دوڑ میں نئے صارفین کو راغب کرے گا۔
(ٹیک کرنچ کے مطابق، ٹام کی گائیڈ)

ماخذ: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
تبصرہ (0)