
در رویداد Google I/O 2025، گوگل با معرفی مدل ساخت ویدیوی هوش مصنوعی خود به نام Veo 3، دنیای فناوری را شوکه کرد و گامی بزرگ برای این غول فناوری در عرصهای بسیار بحثبرانگیز برداشت.
به گفته آلیسون جانسون، خبرنگار The Verge ، پیچیدهترین جنبه Veo 3 توانایی آن در ایجاد صدای اصلی برای هر ویدیو، از جلوههای صوتی و نویز پسزمینه گرفته تا دیالوگ شخصیتها است.
خبرنگاری از The Verge اظهار داشت: «Veo 3 به عنوان دستگاهی که کاملاً محتوای هوش مصنوعی «بیارزش» تولید میکند، مرا تحت تأثیر قرار داد.»
ویژگیهای جدید و سطح تکاندهندهای از واقعگرایی.
جاش وودوارد، معاون رئیس گوگل در Gemini، در سخنرانی رونمایی از Veo 3 با تأکید بر توانایی آن در ایجاد ویدیوهای «بسیار واقعگرایانه» توضیح داد: «ما در حال ورود به عصر جدیدی از خلاقیت هستیم.»
جانسون در ابتدا مردد بود، اما پس از تجربه شخصی با ابزار هوش مصنوعی، تأیید کرد که وودوارد اغراق نمیکرده است. وئو ۳ قادر به ایجاد محصولات بسیار واقعگرایانه است.
به طور خاص، یک خبرنگار از The Verge سعی کرد ویدیوی کوتاهی از یک گوینده خبر که آتشسوزی را اعلام میکرد، بسازد. این کلیپ فوقالعاده قانعکننده بود، با صدا و تصاویری شبیه به هر پخش خبری سنتی.
![]() |
صحنهای از ویدیویی که توسط Veo 3 ساخته شده است. عکس: The Verge. |
کمی بعد، این پست که شامل مجموعهای از ویدیوها با حضور شخصیتهای تولید شده توسط هوش مصنوعی بود که به دستورات استفاده شده برای ساخت ویدیوهای هوش مصنوعی اعتراض داشتند، ۵۰ هزار لایک در ردیت به دست آورد. صحنهها شامل یک فاجعه، زنی که روی تخت بیمارستان دراز کشیده و از لوله تنفسی استفاده میکند و شخصیتی که با اسلحه تهدید میشود - همه با دیالوگهای گفتاری و صداهای پسزمینه واقعگرایانه.
در مقایسه با سایر ابزارهای ساخت ویدیوی هوش مصنوعی، Veo 3 کار را بسیار سادهتر کرده است. تنها چیزی که لازم است یک دستور ساده، چند دقیقه زمان برای پردازش توسط پلتفرم و اشتراک در طرح AI Ultra گوگل ( ۲۴۹.۹۹ دلار در ماه) است.
جانسون حتی متوجه شد که ساخت ویدیو با استفاده از دستورات غیرمشخصتر آسانتر است و این یک چیز را ثابت میکند: Veo 3 در ساخت نوعی از محتوای یوتیوب با کمترین مخرج مشترک برای کودکان، عالی عمل میکند.
پایان «عصر فیلم صامت»
تا به امروز، هیچ مدل ساخت ویدیوی هوش مصنوعی نتوانسته است همزمان صدای هماهنگ یا هر نوع صدایی را برای همراهی با خروجی ویدیو ارائه دهد. با این حال، Veo 3 - با قابلیت ایجاد صدای هماهنگ - قصد دارد به «دوران فیلم صامت» پایان دهد.
دمیس هاسابیس، مدیرعامل گوگل دیپمایند، در یک کنفرانس مطبوعاتی گفت: «ما در حال خروج از دوران خاموش تولید ویدیو هستیم.»
دسترسی گسترده به ابزارها برای سازندگان ویدیو منجر به انفجار فروشندگان شده است تا جایی که این فضا در حال اشباع شدن است.
از استارتآپهایی مانند Runway، Lightricks، Genmo، Pika، Higgsfield، Kling و Luma گرفته تا غولهای فناوری مانند OpenAI و Alibaba، مدلها با سرعت زیادی در حال انتشار هستند. در بسیاری از موارد، تفاوت چندانی بین این مدلها وجود ندارد.
هنوز مشخص نیست که آیا Veo 3 میتواند از نظر کیفیت ویدیو از OpenAI Sora پیشی بگیرد یا خیر. با این حال، صرفاً توانایی خروجی گرفتن از کلیپهای ویدیویی کاملاً تولید شده با تصویر و صدا میتواند فوراً Veo 3 را به پلتفرمی جذابتر تبدیل کند.
![]() |
برجستهترین ویژگی Veo 3 توانایی آن در ایجاد صدای هماهنگ و «کامل» با ویدیو است. تصویر: گوگل. |
جانسون اظهار داشت: «در دنیای فیلم و تلویزیون، نویز پسزمینه و جلوههای صوتی معمولاً کار هنرمندان است. حالا تصور کنید اگر تنها کاری که باید انجام دهید این بود که صدایی را که میخواهید در پسزمینه و مرتبط با صحنه باشد، برای Veo توصیف کنید و آن همه چیز، از جمله ویدیو و دیالوگ را در خروجی ارائه دهد. این کاری است که انیماتورها هفتهها یا ماهها طول میکشد تا آن را تکمیل کنند.»
اگر Veo 3 واقعاً بتواند از دستورات پیروی کند و ساعتها ویدئو و صدای مداوم تولید کند، طولی نخواهد کشید که اولین فیلم انیمیشن کاملاً ساخته شده با هوش مصنوعی را خواهیم داشت.
بلافاصله پس از انتشار Veo 3، سازندگان شروع به اشتراکگذاری کلیپها در پلتفرمهایی مانند X کردند، که مهمترین آنها یک ویدیوی استندآپ کمدی بود که کاملاً توسط هوش مصنوعی ساخته شده بود. بینندگان با کمال تعجب متوجه شدند که کل صحنه، شامل صداگذاری، ویدیو و حتی صداهای تماشاگران، از یک فرمان نوشتاری واحد تولید شده است.
سپس، کلیپ دیگری به سرعت پخش شد که فیثاغورث را در حال توضیح قضیه معروفش، با فضایی باستانی و دیالوگهای دقیق، بازسازی میکرد. حتی یک موزیک ویدیو هم وجود داشت که کاملاً توسط Veo 3 تولید شده بود و در آن هم تصاویر و هم موسیقی کاملاً هماهنگ بودند.
روزنامه اکونومیک تایمز اظهار داشت که این نوع فناوری را میتوان «عصر جدیدی از فیلمسازی» نامید که به هر کسی - از سازندگان شخصی گرفته تا استودیوهای بزرگ رسانهای - اجازه میدهد محتوای حرفهای را با هزینه کم و با حداقل منابع تولید کند.
منبع: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html








نظر (0)