Das herausragendste Merkmal von VASA-1 ist die Möglichkeit, beliebige Bilder zu animieren. Nutzer können beispielsweise ein Foto einer Person aufnehmen und diese Person ausdrucksstark bewegen, sprechen und singen lassen. Besonders interessant an dieser KI-Lösung ist der hohe Grad an Realismus, den sie erzielt.
VASA-1 kann Fotos lebendiger machen.
Die VASA-1-Lösung zielt darauf ab, die Zugänglichkeit für Menschen mit Kommunikationsschwierigkeiten zu verbessern. Sie bietet ihnen Begleitung oder therapeutische Unterstützung und ermöglicht die Erstellung realistischer, sprechender Gesichter in Echtzeit. VASA-1 benötigt lediglich ein Bild des Gesichts der Person, der eine Stimme hinzugefügt werden soll. Zusätzlich können Nutzer weitere Elemente hinzufügen, um die Darstellung noch realistischer zu gestalten. So lassen sich beispielsweise die Augenposition und die Mundbewegungen anpassen, sodass das Gesicht lächelt oder ruft.
Microsoft hebt den Realismus und die lebensechte Qualität dieser Videos hervor, die aus Fotos von Personen erstellt werden. Es geht aber nicht nur um die Möglichkeit, Zeichnungen oder Kunstwerken auf einfache und realistische Weise Stimme und Bewegung hinzuzufügen; VASA-1 ist auch in der Lage, Emotionen, Gesichtsausdrücke und sogar Kopfbewegungen hinzuzufügen.
VASA-1 wird nicht öffentlich zugänglich gemacht.
Ähnlich wie bei OpenAIs Sora weist Microsoft darauf hin, dass VASA-1 nicht öffentlich zugänglich sein wird, da keine Demos, APIs, Produkte oder Dienstleistungen im Zusammenhang mit VASA-1 veröffentlicht werden. Möglicherweise handelt es sich lediglich um die erste Version dieser neuen Technologie, die sich noch in der Entwicklung befindet. Microsoft befürchtet zudem, dass Deepfakes missbräuchlich eingesetzt werden könnten. Daher ist es wahrscheinlich, dass VASA-1 nur im Rahmen von Vereinbarungen mit spezialisierten Zentren genutzt wird, die mit Menschen mit Kommunikationsschwierigkeiten arbeiten.
Möglicherweise wird VASA-1 zukünftig eingesetzt, jedoch kontrolliert, um Probleme zu vermeiden. VASA-A richtet sich an öffentliche Organisationen, die benutzerfreundlichere virtuelle Assistenten entwickeln können. Es könnte auch eine Erweiterung für Copilot darstellen und so einen intuitiveren virtuellen Assistenten direkt in Windows integrieren.
Selbst wenn dies jedoch passieren sollte, ist Microsoft sehr um die Sicherheit besorgt, um zu vermeiden, dass die Plattform für betrügerische Zwecke missbraucht wird oder Investitionen in betrügerische Aktivitäten gefördert werden.
Quellenlink






Kommentar (0)