الميزة الأبرز في VASA-1 هي أنه يسمح للمستخدمين بتحريك أي صورة. يمكنهم التقاط صورة لشخص ما وجعل ذلك الشخص يتحرك بشكل معبر ويتحدث ويغني. الأمر المثير للاهتمام في حل الذكاء الاصطناعي هذا هو المستوى العالي من الواقعية الذي يوفره.
يركز حل VASA-1 على تحسين إمكانية الوصول للأشخاص الذين يعانون من صعوبات في الاتصال. ويسعى إلى توفير الرفقة أو الدعم العلاجي لمن يحتاجون إليه، مما يسمح بإنشاء وجوه ناطقة واقعية في الوقت الفعلي. كان طلب VASA-1 مجرد صورة لوجه الشخص الذي أرادوا إضافة صوته. بالإضافة إلى ذلك، فهو يسمح للمستخدمين بإضافة عناصر أخرى لجعل الأمور أكثر واقعية. ويمكن للمستخدمين أيضًا تعديل موضع العينين أو حركة الفم، مما يجعل الوجه يبتسم أو يصرخ.
تؤكد Microsoft على مدى واقعية وغامرة إنشاء مقاطع الفيديو هذه من صور الشخص، لكن الأمر لا يتعلق فقط بالقدرة على إضافة الصوت والحركات الواقعية السهلة إلى الرسومات أو الصور المجمعة، يتمتع VASA-1 بالقدرة على إضافة المشاعر وتعبيرات الوجه والتعبيرات. القدرة على إضافة الحركة إلى الرأس.
ومع ذلك، مثل OpenAI's Sora، تحذر Microsoft من أنه لن يكون من الممكن الوصول إلى VASA-1 لأنها لن تنشر أي عروض توضيحية أو واجهات برمجة التطبيقات أو المنتجات أو الخدمات المتعلقة بـ VASA-1. ربما يكون هذا مجرد الإصدار الأول من هذه التقنية الجديدة وهو في مرحلة التطوير، وتشعر مايكروسوفت بالقلق من مخاطر استخدام التزييف العميق لأغراض ضارة. ولذلك، يبدو أنه يستخدم فقط في الترتيبات مع المراكز المتخصصة التي تعمل مع الأشخاص الذين يعانون من مشاكل التواصل المختلفة.
ربما سيتم نشر VASA-1 في المستقبل، ولكن بطريقة محكمة لتجنب المشاكل. المرافق التي يستهدفها VASA-A هي مؤسسات عامة يمكنها إنشاء مساعدين افتراضيين أكثر سهولة في الاستخدام، ويمكن أن تكون أيضًا ميزة إضافية لبرنامج Copilot، مما يؤدي إلى إنشاء مساعدين افتراضيين بالقرب من Windows.
ومع ذلك، حتى لو حدث ذلك، فإن Microsoft تشعر بقلق بالغ بشأن المشكلات الأمنية لتجنب استخدامها في منصات احتيالية أو تشجيع الاستثمار في الأنشطة الاحتيالية.