Google hat Bard bereits in viele Apps wie Gmail, YouTube, Google Maps und Flights integriert und sich damit einen großen Vorteil gegenüber ChatGPT verschafft. OpenAI hat daher kürzlich angekündigt, dass die kostenlose Version von ChatGPT bald Sprach- und Bildeingabe ermöglichen wird.
Das bedeutet, dass Nutzer ChatGPT-Fragen natürlicher stellen können als beim Tippen auf iPhone und Android oder sogar Bilder verwenden können, um bessere Antworten zu erhalten. Der Clou: Nutzer müssen für Updates nicht für ChatGPT Plus bezahlen, zahlende Kunden erhalten jedoch zuerst eine Testversion.
Plus- und Enterprise-Kontoinhaber erhalten dieses Update in den nächsten zwei Wochen, gefolgt von anderen Nutzergruppen, darunter Entwickler. Die Verwendung von Bildern als Eingabe in ChatGPT ist die Funktionsweise multimodaler KI-Modelle. Dies ähnelt der Vorgehensweise des Suchmaschinenriesen bei der Nutzung von Google Lens mit KI.
Zwei neue Funktionen auf ChatGPT sollen voraussichtlich mehr Nutzer anziehen als Google Bard.
Die Sprachunterstützungsfunktion ist vorerst nur in der ChatGPT-App für iPhone und Android verfügbar. Nutzer müssen sie lediglich in den App-Einstellungen aktivieren. Laut OpenAI benötigt ChatGPT nur wenige Sekunden Sprachbeispiel, um aus Text menschenähnliche Audioausgabe zu generieren. Hierfür kommt ein neues Text-zu-Sprache-Modell zum Einsatz.
Die Technologie, die innerhalb von Sekunden realistische synthetische Stimmen aus realer Sprache erzeugen kann, eröffnet zahlreiche innovative und auf Barrierefreiheit ausgerichtete Anwendungsmöglichkeiten. Sie birgt jedoch auch neue Risiken, wie etwa die Möglichkeit, sich als Prominente auszugeben oder Betrug zu begehen. OpenAI gab außerdem bekannt, gemeinsam mit Spotify eine Sprachübersetzungsfunktion für Podcasts zu testen, mit der Podcaster ihre Inhalte mithilfe ihrer eigenen Stimme in andere Sprachen übersetzen können.
Quellenlink






Kommentar (0)