Vietnam.vn - Nền tảng quảng bá Việt Nam

ٹیکسٹ ٹو ویڈیو AIs جیسے Sora

Báo Thanh niênBáo Thanh niên20/02/2024


صورہ (اوپن اے آئی)

سورا ایک تازہ ترین نام ہے جس کا اعلان کیا گیا ہے لیکن اس نے سب سے زیادہ ہلچل مچا دی ہے، ایک وجہ یہ ہے کہ یہ OpenAI کا پروڈکٹ ہے - ChatGPT کے مشہور ڈویلپر، لیکن بنیادی طور پر ویڈیوز کے معیار کی وجہ سے جو پروگرام صرف ٹیکسٹ کمانڈز سے بناتا ہے۔

ChatGPT کے ساتھ کمپنی کی کامیابی اس کے AI کو زبان کی گہری سمجھ بھی دیتی ہے۔ سورا کی صلاحیتوں کو ظاہر کرنے والے کلپس میں کرداروں کو حرکت کرتے اور خود کو اس انداز میں ظاہر کرتے ہوئے دکھایا گیا ہے جو انسانی شاٹ فلم کی طرح زندگی کی طرح ہے۔

Video "siêu thực" do Sora tạo từ các lệnh văn bản

سورا کی طرف سے ٹیکسٹ کمانڈز سے تخلیق کردہ "حقیقت پسندانہ" ویڈیو

لیکن حفاظتی وجوہات کی بناء پر سورا ابھی تک عوامی استعمال کے لیے دستیاب نہیں ہے۔ OpenAI اسے عام لوگوں کے لیے دستیاب کرنے سے پہلے احتیاط سے اقدامات کرے گا، خاص طور پر AI صارفین کی بڑھتی ہوئی تعداد کو دیکھتے ہوئے جو مذموم مقاصد کے لیے استعمال ہو رہے ہیں، جیسے کہ صارفین کی نقالی کرنا یا جرم کرنا۔

Lumiere (گوگل)

Lumiere گوگل کی طرف سے ایک پروڈکٹ ہے، جو STUNet (Space-Time-U-Net) ڈھانچے کے ڈفیوژن ماڈل کی بنیاد پر ٹیکسٹ ان پٹ سے ویڈیوز بنانے کے قابل بھی ہے۔ Lumiere اسٹیل فریموں کو ایک ساتھ سلائی کرنے سے پریشان نہیں ہوتا ہے، لیکن اس کے بجائے، یہ AI ویڈیو میں تفصیلات کی شناخت کرتا ہے (مقامی حصہ)، ٹریک کرتا ہے کہ وہ کس طرح حرکت کرتے ہیں، ایک ہی وقت میں تبدیل ہوتے ہیں (عارضی حصہ)، اس طرح عمل کو آسانی سے چلانے میں مدد ملتی ہے۔

سورا کی طرح، Lumiere کو عوام کے لیے جاری نہیں کیا گیا ہے۔ کمپنی نے اس ماڈل کو جنوری 2024 کے آخر میں جیمنی کے آغاز کے بعد ہی متعارف کرایا تھا - ایک بڑی زبان کا ماڈل جسے ابھی بارڈ کے ساتھ ہم آہنگ کیا گیا ہے۔

VideoPoet (گوگل)

اس بڑے لینگویج ماڈل (LLM) کو 2023 میں گوگل سرچ کے ذریعے تیار کردہ ویڈیوز، تصاویر، آڈیو اور ٹیکسٹ کے ایک بڑے ذخیرے سے تربیت دی گئی ہے۔ VideoPoet ان پٹ ذرائع سے مختلف کام انجام دے سکتا ہے جیسے کہ ٹیکسٹ، تصاویر، ویڈیوز... ویڈیوز بنانے، مواد کو نمایاں کرنے، ویڈیوز کو آڈیو میں تبدیل کرنے، اسٹیل امیجز کو اینیمیشن میں تبدیل کرنے کے لیے...

VideoPoet کا اصل خیال کسی بھی خودکار زبان کے ماڈل کو ویڈیو جنریشن سسٹم میں ترجمہ کرنے کی ضرورت سے پیدا ہوا ہے۔ موجودہ خودکار زبان کے ماڈل انسانوں کی طرح متن اور پروگرامنگ کوڈ پر کارروائی کر سکتے ہیں، لیکن جب ویڈیو کی بات آتی ہے تو جدوجہد کرتے ہیں۔ VideoPoet کسی بھی فارمیٹ سے ان پٹ کو اس زبان میں ترجمہ کرنے کے لیے ٹوکنائزیشن کا استعمال کرکے اسے حل کرتا ہے جسے وہ سمجھ سکتا ہے۔

Các công cụ tạo ra video từ văn bản đa phần đang thử nghiệm giới hạn

متن سے ویڈیوز بنانے کے ٹولز زیادہ تر اپنی حدود کی جانچ کر رہے ہیں۔

ایمو ویڈیو (میٹا)

گوگل اور اوپن اے آئی کے علاوہ، میٹا بھی ان بڑی ٹیکنالوجیز میں سے ایک ہے جو AI بنانے میں سرگرم ہے۔ فیس بک کی مالک کمپنی نے ایمو ویڈیو کے نام سے ویڈیو بنانے والی اے آئی بھی تیار کی ہے، جو تصاویر کو ٹیکسٹ میں تبدیل کر سکتی ہے اور پھر اسے کلپس بنانے کے لیے ڈیٹا کے طور پر استعمال کر سکتی ہے۔

ایمو ویڈیو کو بیٹا ٹیسٹرز سے مثبت جائزے مل رہے ہیں، 81% اسے امیجین ویڈیو (گوگل) پر ترجیح دے رہے ہیں۔ 90% سے زیادہ نے PYOCO (Nvidia) پر میٹا کے ماڈل کا انتخاب کیا، جو کہ Meta کے Make-A-Video (96%) سے بھی بہتر ہے۔

CogVideo (سنگھوا یونیورسٹی، چین)

مندرجہ بالا ماڈلز کے برعکس، جو کہ دنیا کی معروف ٹیکنالوجی کمپنیوں کی تمام مصنوعات ہیں، CogVideo ایک AI ہے جسے سنگھوا یونیورسٹی کی ایک تحقیقی ٹیم نے تیار کیا ہے - جو چین کے ساتھ ساتھ ایشیا کا ایک اعلیٰ باوقار اسکول ہے۔ یہ پروگرام CogView2 پر مبنی ہے، جو پہلے سے تربیت یافتہ ٹیکسٹ ٹو امیج ماڈل ہے۔

کمپیوٹر آرٹ کے ماہر گلین مارشل، جنہوں نے CogVideo کا تجربہ کیا، نے کہا کہ "ڈائریکٹر اپنی ملازمتوں سے محروم ہو سکتے ہیں۔" اس کا کلپ، جسے The Crow کہا جاتا ہے، CogVideo کی مدد سے تیار کیا گیا تھا، کو بہت پذیرائی ملی اور اسے برٹش اکیڈمی فلم ایوارڈ (BAFTA) کے لیے نامزد کیا گیا۔



ماخذ لنک

تبصرہ (0)

No data
No data

اسی موضوع میں

اسی زمرے میں

ہیرو آف لیبر تھائی ہوانگ کو کریملن میں روسی صدر ولادیمیر پوتن نے براہ راست فرینڈشپ میڈل سے نوازا۔
Phu Sa Phin کو فتح کرنے کے راستے میں پری کائی کے جنگل میں کھو گیا۔
آج صبح، Quy Nhon ساحلی شہر دھند میں 'خواب بھرا' ہے۔
'کلاؤڈ ہنٹنگ' سیزن میں ساپا کی دلکش خوبصورتی

اسی مصنف کی

ورثہ

پیکر

کاروبار

آج صبح، Quy Nhon ساحلی شہر دھند میں 'خواب بھرا' ہے۔

موجودہ واقعات

سیاسی نظام

مقامی

پروڈکٹ