VASA-1 の最も注目すべき機能は、ユーザーが任意の画像をアニメーション化できることです。人の写真を撮り、その人を表情豊かに動かしたり、話したり、歌わせたりすることができます。この AI ソリューションの興味深い点は、それが提供する高度なリアリズムです。
VASA-1 ソリューションは、コミュニケーションに困難がある人々のアクセシビリティの向上に焦点を当てています。それは、それを必要とする人々に交際や治療上のサポートを提供することを目的としており、リアルな会話の顔をリアルタイムで作成できるようにします。 VASA-1のリクエストは、音声を追加したい人の顔の画像だけでした。さらに、ユーザーは他の要素を追加して、物事をより現実的にすることができます。ユーザーは目の位置や口の動きを編集して、顔を笑ったり叫んだりすることもできます。
Microsoft は、これらのビデオが人の写真からいかに現実的で臨場感のあるものに作成されているかを強調していますが、それは音声や簡単で現実的な動きを絵やコラージュに追加する機能だけではなく、VASA-1 には感情、表情、および感情を追加する機能があります。頭に動きを加える機能。
ただし、OpenAIのSoraと同様に、MicrosoftはVASA-1に関連するデモ、API、製品、サービスを公開しないため、VASA-1にはアクセスできなくなると警告している。おそらくこれはこの新しいテクノロジーの最初のバージョンにすぎず、開発段階にあり、マイクロソフトはディープフェイクが悪意のある目的で使用されるリスクを懸念しています。そのため、さまざまなコミュニケーション上の問題を抱えた人々を扱う専門センターとの取り決めでのみ使用されているようです。
おそらく将来的には VASA-1 が導入されることになるでしょうが、問題を回避するために制御された方法で導入されることになります。 VASA-A が対象とする施設は、よりユーザーフレンドリーな仮想アシスタントを作成できる公的組織であり、Copilot の追加機能として Windows に近い仮想アシスタントを作成することもできます。
ただし、たとえそれが起こったとしても、マイクロソフトは、詐欺的なプラットフォームに使用されたり、詐欺的な活動への投資を奨励したりすることを避けるために、セキュリティの問題を非常に懸念しています。