Vietnam.vn - Nền tảng quảng bá Việt Nam

Las herramientas de inteligencia artificial para convertir voz a texto también "tergiversan"

Công LuậnCông Luận29/10/2024

(CLO) La herramienta de conversión de voz a texto Whisper de OpenAI se promociona como "robótica y precisa a nivel casi humano", pero tiene un inconveniente importante: ¡es propensa a fabricar fragmentos de texto o incluso oraciones completas!


Algunos de los textos que produce, conocidos en la industria como alucinógenos, pueden incluir comentarios raciales, violencia e incluso tratamientos médicos imaginarios, dicen los expertos.

Los expertos dicen que estas invenciones son graves porque Whisper se utiliza en una amplia gama de industrias en todo el mundo para traducir y transcribir entrevistas, generar textos y subtitular vídeos.

Lo que es más preocupante es que los centros médicos están utilizando herramientas basadas en Whisper para registrar las consultas entre pacientes y médicos, a pesar de la advertencia de OpenAI de que la herramienta no debe utilizarse en "zonas de alto riesgo".

Herramienta de conversión de voz a texto que cualquier persona puede manipular imagen 1

Las frases que empiezan con "#Verdad fundamental" corresponden a lo que realmente se dijo; las frases que empiezan con "#texto" corresponden a lo que Whisper transcribió. Foto: AP

Investigadores e ingenieros afirman que Whisper produce alucinaciones con frecuencia durante su uso. Por ejemplo, un investigador de la Universidad de Michigan afirmó haber encontrado alucinaciones en ocho de cada diez grabaciones que examinó.

Un ingeniero de aprendizaje automático inicial detectó la manipulación en aproximadamente la mitad de las más de 100 horas de transcripciones de Whisper que analizó. Un tercer desarrollador afirmó haber encontrado la ilusión en casi todas las 26.000 transcripciones creadas con Whisper.

La ilusión persiste incluso en muestras de audio cortas y bien grabadas. Un estudio reciente realizado por informáticos detectó 187 distorsiones en más de 13 000 clips de audio nítidos examinados.

Esa tendencia resultaría en decenas de miles de errores en millones de grabaciones, dijeron los investigadores.

Estos errores pueden tener “consecuencias realmente graves”, especialmente en el ámbito hospitalario, afirmó Alondra Nelson, profesora de la Facultad de Ciencias Sociales del Instituto de Estudios Avanzados.

“Nadie quiere que le diagnostiquen mal. Es necesario que haya una mayor barrera”, dijo Nelson.

Las profesoras Allison Koenecke y Mona Sloane de la Universidad de Virginia, pertenecientes a la Universidad de Cornell, examinaron miles de fragmentos breves recuperados de TalkBank, un archivo de investigación de la Universidad Carnegie Mellon. Determinaron que casi el 40 % de las alucinaciones eran dañinas o perturbadoras, ya que el hablante podía ser malinterpretado o tergiversado.

En una de las grabaciones, un orador describió a "otras dos niñas y una mujer", pero Whisper inventó comentarios raciales adicionales y agregó: "otras dos niñas y una mujer, eh, negra".

En otra transcripción, Whisper inventó un fármaco inexistente llamado "antibióticos con actividad aumentada".

Aunque la mayoría de los desarrolladores asumen que las herramientas de transcripción pueden cometer errores ortográficos u otros errores, los ingenieros e investigadores dicen que nunca han visto una herramienta de transcripción impulsada por IA que sea tan alucinógena como Whisper.

La herramienta está integrada en varias versiones del chatbot insignia de OpenAI, ChatGPT, y es un servicio integrado en las plataformas de computación en la nube de Oracle y Microsoft, que presta servicio a miles de empresas en todo el mundo. También se utiliza para transcribir y traducir texto a numerosos idiomas.

Ngoc Anh (según AP)


[anuncio_2]
Fuente: https://www.congluan.vn/cong-cu-chuyen-giong-noi-thanh-van-ban-ai-cung-co-the-xuyen-tac-post319008.html

Kommentar (0)

No data
No data
Escena mágica en la colina del té "cuenco al revés" en Phu Tho
Tres islas de la región central se asemejan a las Maldivas y atraen turistas en verano.
Contemple la brillante ciudad costera de Quy Nhon, Gia Lai, por la noche.
Imagen de campos en terrazas en Phu Tho, con suave pendiente, brillantes y hermosos como espejos antes de la temporada de siembra.
La fábrica Z121 está lista para la Noche Final Internacional de Fuegos Artificiales
La famosa revista de viajes elogia la cueva Son Doong como "la más magnífica del planeta"
Una cueva misteriosa atrae a turistas occidentales, comparada con la "cueva Phong Nha" en Thanh Hoa
Descubra la belleza poética de la bahía de Vinh Hy
¿Cómo se procesa el té más caro de Hanoi, cuyo precio supera los 10 millones de VND/kg?
Sabor de la región del río

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto