Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

AI کا 'پردے کے پیچھے' جو منٹوں میں ٹیکسٹ کو ویڈیو میں بدل دیتا ہے۔

صرف چند کمانڈز کے ساتھ، AI وشد فریم بنا سکتا ہے، پس منظر، روشنی سے لے کر ہر چھوٹی موومنٹ تک... یہ کیسے کرتا ہے؟

Báo Tuổi TrẻBáo Tuổi Trẻ16/08/2025

AI - Ảnh 1.

AI ٹولز کا استعمال کرتے ہوئے تصویر بنانا

ماضی میں، ایک ویڈیو بنانے کے لیے، آپ کو ایک کیمرہ، ایک ڈائریکٹر، اداکاروں اور ایڈیٹنگ کے گھنٹوں کی ضرورت ہوتی تھی۔ اب، کی بورڈ پر صرف چند الفاظ کے ساتھ، AI سیٹنگ سے لے کر ہر چھوٹی موومنٹ کے لیے لائٹنگ، مکمل فریم بنا سکتا ہے۔

اس "معجزہ" کے پیچھے جدید ترین ٹیکنالوجیز کا ایک سلسلہ ہے جس کے بارے میں بہت کم لوگ جانتے ہیں۔

متن سے تصویر تک: پہلا سفر

Tuoi Tre Online کی تحقیق کے مطابق، جب آپ کچھ وضاحتی جملے ٹائپ کرتے ہیں، تو AI سسٹم سب سے پہلے قدرتی زبان کی پروسیسنگ (NLP) ٹیکنالوجی کا استعمال کرتے ہوئے مواد کو "سمجھے گا"۔ یہ نہ صرف ہر لفظ کو پہچانتا ہے، بلکہ AI جملہ میں موجود عناصر کے درمیان سیاق و سباق، جذبات اور تعلقات کا بھی تجزیہ کرتا ہے۔

مثال کے طور پر، اگر آپ "پرانے شہر پر دوپہر کی بارش" لکھتے ہیں، تو AI کو معلوم ہو جائے گا کہ یہ ایک بیرونی منظر ہے، جس میں موسمی عناصر، دوپہر کی روشنی اور کلاسیکی تعمیراتی مناظر شامل ہیں۔

مواد کو سمجھنے کے بعد، AI ابتدائی جامد امیج جنریشن کے مرحلے میں چلا جاتا ہے۔ اس مرحلے میں ایک عام تکنیک ڈفیوژن ماڈل ہے، جہاں AI شور والے سفید پس منظر سے تصویر کو "پینٹ" کرتا ہے جب تک کہ ہر تفصیل نظر نہ آئے۔ ہر پکسل کا حساب اس بات کو یقینی بنانے کے لیے کیا جاتا ہے کہ روشنی، رنگ، ساخت، اور انداز جیسا کہ بیان کیا گیا ہے۔

بہت کم لوگ جانتے ہیں کہ اس مرحلے کے دوران، AI درجنوں ٹیسٹ ورژن بنا سکتا ہے اور جاری رکھنے سے پہلے بہترین کا انتخاب کر سکتا ہے۔

ایک اور "راز" یہ ہے کہ جدید نظاموں میں بہت سے ذرائع سے تربیت یافتہ تصاویر کے بڑے ڈیٹا بیس کو بھی شامل کیا جاتا ہے۔ یہ AI کو لاکھوں تفصیلات کی یاد دلاتا ہے، جس طرح سے پانی روشنی کو منعکس کرتا ہے، جس طرح سے درخت ہوا میں جھکتے ہیں، تاکہ پہلا فریم جتنا ممکن ہو قدرتی نظر آئے۔

کس طرح AI تصاویر کو ہموار حرکت میں بدل دیتا ہے۔

ایک بار جب پہلا فریم مکمل ہو جاتا ہے، تو سب سے بڑا چیلنج اسے تصاویر کی ترتیب میں تبدیل کرنا ہے جو محسوس ہوتا ہے کہ یہ حرکت کر رہا ہے۔ AI یہ تصور کرنے کے لیے حرکت کی پیشن گوئی کے ماڈلز کا استعمال کرتا ہے کہ ہر شے وقت کے ساتھ کیسے بدلے گی۔ یہ وہ جگہ ہے جہاں فزکس الگورتھم آتے ہیں، کشش ثقل، ہوا، پانی، اور ورچوئل کیمرہ شیک جیسی چیزوں کی تقلید کرتے ہیں۔

مناظر کو ہکلانے سے روکنے کے لیے، AI فریم انٹرپولیشن کا استعمال کرتا ہے۔ یہ دو لمحوں کے درمیان درمیانی فریموں کو "تصور" کرتا ہے، پھر انہیں ہموار حرکت میں جوڑتا ہے۔ اگر ویڈیو میں کردار ہیں، تو سسٹم کو سیاق و سباق سے ملنے کے لیے جسم کی حرکات، چہرے کے تاثرات، اور آنکھوں کے رابطے کو بھی پروسیس کرنا پڑتا ہے۔

بہت کم معلوم راز: ڈسپلے کرنے سے پہلے، بہت سے AI سسٹم خودکار "پوسٹ پروڈکشن" مرحلہ بھی انجام دیتے ہیں۔ وہ رنگ، روشنی کو ایڈجسٹ کرتے ہیں، دھندلاپن یا گہرائی کے اثرات شامل کرتے ہیں تاکہ ویڈیو کو ایسا نظر آئے جیسے اسے کسی پیشہ ور کیمرہ نے شوٹ کیا ہو۔ کچھ پلیٹ فارم مناسب محیطی شور اور پس منظر کی موسیقی بھی بناتے ہیں، جس سے حتمی مصنوعہ ایک حقیقی منظر کی طرح لگتا ہے۔

لینگویج پروسیسنگ، تھری ڈی رینڈرنگ، فزکس سمولیشن سے لے کر پوسٹ پروڈکشن ایڈیٹنگ تک، متن کی صرف چند سطروں کے ساتھ بہت سی ٹیکنالوجیز کے امتزاج کی بدولت، صارفین ایک مکمل ویڈیو کے مالک ہو سکتے ہیں۔ یہ بے ترتیبی بہت سے لوگوں کو یہ سوچنے پر مجبور کرتی ہے کہ AI "فلمنگ" ہے، لیکن درحقیقت ہر چیز صفر سے، فریم بہ فریم، اس رفتار سے بنائی گئی ہے جس سے انسان میچ نہیں کر سکتے۔

واپس موضوع پر
Tuan Vi

ماخذ: https://tuoitre.vn/hau-truong-ai-chuyen-van-ban-thanh-video-trong-vai-phut-20250815190549144.htm


تبصرہ (0)

No data
No data

اسی موضوع میں

اسی زمرے میں

Su 30-MK2 لڑاکا طیاروں نے جامنگ گولے گرائے، ہیلی کاپٹروں نے دارالحکومت کے آسمان پر پرچم بلند کیا
Su-30MK2 لڑاکا طیارہ دارالحکومت کے آسمان پر ایک چمکتا ہوا گرمی کا جال گرا رہا ہے
(لائیو) 2 ستمبر کو قومی دن منانے کے لیے جشن، پریڈ، اور مارچ کی جنرل ریہرسل
ڈوونگ ہوانگ ین ایک کیپیلا گاتا ہے "فادر لینڈ ان دی سن لائٹ" جس سے شدید جذبات پیدا ہوتے ہیں

اسی مصنف کی

ورثہ

پیکر

کاروبار

No videos available

خبریں

سیاسی نظام

مقامی

پروڈکٹ