Tras el furor de DeepSeek, las principales empresas tecnológicas chinas se apresuraron a lanzar modelos de lenguaje grande (LLM) para competir y ganar participación de mercado.
La tecnología global se está acelerando
El 29 de enero, el primer día del Año Nuevo Lunar de 2025, el Grupo Alibaba lanzó una nueva versión del modelo de inteligencia artificial (IA) Qwen 2.5 y anunció que este modelo es más potente que DeepSeek. Según Alibaba, Qwen 2.5 "supera en casi todos los aspectos" a los modelos de IA más avanzados de OpenAI y Meta (EE. UU.), como GPT-4o y Llama-3.1-405B.
Anteriormente, DeepSeek lanzó asistentes de IA utilizando los modelos DeepSeek-V3 y DeepSeek-R1 a un costo solo una fracción del de los productos de empresas estadounidenses.
Dos "terremotos", DeepSeek y Alibaba, han desatado una carrera por la actualización de la IA en China. Cabe destacar que el chatbot de IA de bajo costo ChatGLM fue desarrollado por un equipo de investigación de la Universidad de Tsinghua y Zhipu AI Company. ChatGLM es un chatbot de IA de código abierto capaz de generar texto, traducir y responder preguntas.
Ernie Bot, del gigante tecnológico Baidu, también lanzó una versión mejorada, Ernie 4.0 Turbo, capaz de realizar varias tareas, incluida la generación de texto, traducción, respuesta a preguntas, creación de imágenes, etc. Mientras tanto, ByteDance, la empresa matriz de TikTok, actualizó su modelo insignia de IA y anunció que pasó el o1 de OpenAI en la prueba AIME, un estándar que mide la capacidad de la IA para procesar y responder a instrucciones complejas.
DeepSeek también amenaza el mercado global, obligando a gigantes tecnológicos como OpenAI, Meta, Google y Microsoft a ajustar sus estrategias de inversión. Las corporaciones tecnológicas estadounidenses invertían anteriormente en fábricas de IA y de datos, pero a partir de ahora deberán centrarse en mejorar los algoritmos para reducir costes y operar con mayor rapidez y eficiencia. Recientemente, OpenAI introdujo la función Deep Research, que ayuda a ChatGPT a sintetizar e investigar información. Lo más destacado de esta función es la posibilidad de mostrar detalles del proceso de investigación, incluyendo citas y resúmenes de los métodos utilizados, lo que facilita a los usuarios el seguimiento y la verificación de la información.
Otros países, como India y Corea del Sur, también participan en el desarrollo de chatbots de IA de bajo coste. Por ejemplo, en India, la empresa Reliance Jio del multimillonario Mukesh Ambani lanzó BharatGPT, el primer chatbot de IA compatible con idiomas locales. Este es un avance significativo en el campo de la IA en India, que facilita el acceso de la tecnología a la población que no habla inglés.
Interfaz de DeepSeek y Qwen 2.5 Foto: Future/Qwen/Shutterstock
¿Qué oportunidades tiene Vietnam?
El Sr. Lu Vincent The Hung, fundador y director ejecutivo de EduX Global Institute Joint Stock Company, afirmó que, en el pasado, la industria tecnológica solía anunciar que el costo de construir modelos de IA ascendía a miles de millones de dólares. Sin embargo, el lanzamiento de R1 por parte de la startup tecnológica DeepSeek, con un costo de tan solo 6 millones de dólares, de ser cierto, podría impulsar a países y startups a desarrollar su propia IA de alto rendimiento y bajo costo. A partir de ahí, las empresas, especialmente las pequeñas y medianas, pueden acceder y aplicar la IA sin tener que invertir demasiado en costos iniciales; además, pueden promover la transformación digital en los sectores de la producción, el comercio, los servicios y la educación .
Sin embargo, el modelo R1 recién lanzado por DeepSeek ha generado numerosas controversias relacionadas con la seguridad de los datos y la copia de modelos de IA de otras empresas tecnológicas. Por lo tanto, para crear sus propios modelos de IA a bajo costo, los países y las empresas deben comprender cuidadosamente los principios operativos, los algoritmos, el código fuente, etc., en lugar de copiar o robar. "Un modelo de IA exitoso no solo se basa en la capacidad de procesamiento, sino también en el costo. Las empresas vietnamitas deberían desarrollar soluciones que puedan expandirse y personalizarse según las necesidades de diversas industrias", sugirió el Sr. Hung.
Según el Sr. Phan Tan Quoc, subdirector del Programa de Innovación de KPMG Vietnam, la feroz competencia en el mercado de la IA ejercerá presión y motivación para que las empresas vietnamitas creen rápidamente modelos útiles y prestigiosos para atender a los usuarios y clientes nacionales. El Sr. Quoc recomendó que el gobierno implemente políticas para incentivar la participación de empresas y particulares en el desarrollo de la IA, la creación de bases de datos y, al mismo tiempo, el apoyo a la inversión en centros de investigación de IA.
La tendencia de compartir código abierto en la comunidad de IA puede ayudar a los desarrolladores a aprovechar y mejorar el modelo. En el futuro, muchas startups y particulares accederán fácilmente a la IA y la aplicarán a sus operaciones cuando surjan nuevos modelos que satisfagan necesidades específicas, afirmó el Sr. Quoc.
Según los expertos, al desarrollar IA, las empresas deben determinar claramente si el modelo puede resolver un problema específico, aportar valor real a los usuarios y presentar características diferenciales o aspectos destacados. El modelo de DeepSeek es una lección para las empresas tecnológicas globales, cuyos costes declarados son extremadamente bajos, pero cuyo rendimiento se afirma que supera a ChatGPT. A continuación, es necesario comprender claramente la demanda de IA en el mercado para garantizar que sea lo suficientemente competitiva y rentable.
¿Es DeepSeek realmente barato?
En su informe, DeepSeek afirmó que el costo total de entrenar el modelo de IA fue inferior a 6 millones de dólares, principalmente debido al alquiler de unidades de procesamiento gráfico de NVIDIA. Sin embargo, recientemente, la firma de investigación y consultoría de semiconductores SemiAnalysis calculó que el costo de desarrollo de DeepSeek fue mucho mayor de lo declarado.
Se estima que DeepSeek opera un sistema informático masivo de aproximadamente 50 000 GPU Hopper, con 10 000 GPU H800 y 10 000 GPU H100 más potentes, además de GPU H20 adicionales. La inversión total en los servidores se estima en unos 1600 millones de dólares y los costos operativos en unos 944 millones de dólares.
Fuente: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
Kommentar (0)