
در رویداد Google I/O 2025، گوگل با معرفی یک مدل هوش مصنوعی تولید ویدیو به نام Veo 3، دنیای فناوری را شوکه کرد و گامی بزرگ برای این غول فناوری در عرصهای بحثبرانگیز برداشت.
طبق تجربه آلیسون جانسون، خبرنگار The Verge ، پیچیدهترین نکته در مورد Veo 3، توانایی آن در ایجاد صدای اصلی برای هر ویدیو، از جلوههای صوتی، نویز پسزمینه گرفته تا حتی دیالوگ شخصیتها است.
خبرنگار The Verge اظهار داشت: «Veo 3 به نظر من یک تولیدکننده محتوای هوش مصنوعی کاملاً «بیارزش» است.»
ویژگیهای جدید و واقعگرایی تکاندهنده
جاش وودوارد، معاون رئیس گوگل در Gemini، در جریان نطق اصلی رونمایی از Veo 3 با اشاره به توانایی ایجاد ویدیوهای «فوقالعاده واقعگرایانه» توضیح داد: «ما در حال ورود به عصر جدیدی از خلاقیت هستیم.»
جانسون در ابتدا مردد بود، اما پس از اینکه خودش این ابزار هوش مصنوعی را تجربه کرد، متقاعد شد که وودوارد اغراق نمیکرد. وئو ۳ قادر به تولید محصولاتی است که به طرز ترسناکی واقعی به نظر میرسند.
به طور خاص، خبرنگار The Verge سعی کرد یک ویدیوی کوتاه با محتوای یک گوینده خبر که آتشسوزی را اعلام میکند، بسازد. این کلیپ بسیار قانعکننده است، کیفیت صدا و صحنهآرایی آن مشابه هر گزارش خبری سنتی است.
![]() |
صحنهای از ویدیویی که توسط Veo 3 ساخته شده است. عکس: The Verge. |
این پست که شامل مجموعهای از ویدیوها با حضور شخصیتهای تولید شده توسط هوش مصنوعی بود که به دستورات استفاده شده برای ایجاد ویدیوهای تولید شده توسط هوش مصنوعی اعتراض داشتند، از آن زمان تاکنون ۵۰،۰۰۰ رأی مثبت در ردیت کسب کرده است. صحنهها شامل یک فاجعه، زنی که روی تخت بیمارستان روی دستگاه تنفس مصنوعی دراز کشیده است و شخصیتی که با اسلحه تهدید میشود - همه با دیالوگهای گفتاری و صداهای پسزمینه واقعگرایانه.
در مقایسه با سایر ابزارهای ساخت ویدیوی هوش مصنوعی، Veo 3 کارها را بسیار سادهتر کرده است. تنها کاری که لازم است انجام دهید یک دستور ساده، چند دقیقه انتظار برای پردازش توسط پلتفرم و عضویت در طرح AI Ultra گوگل ( ۲۴۹.۹۹ دلار در ماه) است.
برای جانسون، ساخت ویدیو با استفاده از دستورات غیرمشخصتر، حتی آسانتر هم بود و این به یک نکته اشاره داشت: Veo 3 در ساخت سادهترین نوع محتوای یوتیوب برای کودکان، عالی عمل میکند.
پایان «دوران فیلم صامت»
تا به امروز، هیچ مدل تولید ویدیوی هوش مصنوعی نتوانسته است همزمان صدای هماهنگ یا اصلاً هر صدایی را برای همراهی با خروجی ویدیو ارائه دهد. با این حال، Veo 3 - با قابلیتهای تولید صدای هماهنگ خود - به دنبال پایان دادن به «عصر سکوت» است.
دمیس هاسابیس، مدیرعامل گوگل دیپمایند، در یک کنفرانس مطبوعاتی گفت: «ما در حال خروج از دوران سکوت تولید ویدیو هستیم.»
دسترسی گسترده به ابزارهای ساخت ویدیو منجر به انفجار فروشندگان شده است تا جایی که این فضا در حال اشباع شدن است.
از استارتآپهایی مانند Runway، Lightricks، Genmo، Pika، Higgsfield، Kling و Luma گرفته تا غولهای فناوری مانند OpenAI و Alibaba، مدلها با سرعت زیادی در حال انتشار هستند. در بسیاری از موارد، تفاوت چندانی بین این مدلها وجود ندارد.
هنوز مشخص نیست که آیا Veo 3 میتواند از نظر کیفیت ویدیو از OpenAI Sora پیشی بگیرد یا خیر، اما قابلیت خروجی گرفتن ویدیوهای کاملاً تولید شده با صدا و تصویر میتواند فوراً Veo 3 را به پلتفرمی جذابتر تبدیل کند.
![]() |
برجستهترین ویژگی Veo 3 توانایی آن در ایجاد هماهنگی «کامل» صدا با ویدیو است. عکس: گوگل. |
جانسون اظهار داشت: «در دنیای فیلم و تلویزیون، نویز پسزمینه و جلوههای صوتی اغلب کار هنرمندان است. حالا تصور کنید اگر تنها کاری که باید انجام میدادید این بود که صدایی را که میخواستید در پسزمینه و به صحنه متصل شود، برای وئو توصیف کنید و وئو همه آن را، از جمله ویدیو و دیالوگ، در خروجی نمایش دهد. این کاری است که انیماتورها هفتهها یا ماهها صرف انجام آن میکنند.»
اگر Veo 3 واقعاً بتواند از دستورات پیروی کند و ساعتها ویدئو و صدای مداوم تولید کند، خیلی طول نخواهد کشید که اولین فیلم بلند انیمیشن را که کاملاً با هوش مصنوعی ساخته شده است، داشته باشیم.
کمی پس از راهاندازی Veo 3، سازندگان شروع به اشتراکگذاری کلیپها در پلتفرمهایی مانند X کردند، از جمله یک ویدیوی استندآپ کمدی که کاملاً با هوش مصنوعی ساخته شده بود. بینندگان با کمال تعجب متوجه شدند که کل صحنه، شامل صدا، ویدیو و حتی صدای حضار، فقط از یک توضیح متنی ساخته شده است.
سپس یک کلیپ پربازدید دیگر وجود دارد که فیثاغورث را در حال توضیح قضیه معروفش، همراه با متن باستانی و دیالوگهای دقیق، بازسازی میکند. حتی یک موزیک ویدیو وجود دارد که کاملاً توسط Veo 3 ساخته شده است، که در آن تصاویر و موسیقی کاملاً با هم هماهنگ هستند.
روزنامه اکونومیک تایمز اظهار داشت که این نوع فناوری را میتوان «عصر جدیدی از فیلمسازی» نامید که به هر کسی - از سازندگان شخصی گرفته تا استودیوهای بزرگ رسانهای - اجازه میدهد محتوای حرفهای را با هزینه کم و با حداقل منابع تولید کند.
منبع: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
نظر (0)