Nach dem DeepSeek-Boom begannen die großen chinesischen Technologieunternehmen schnell mit der Einführung großer Sprachmodelle (LLMs), um wettbewerbsfähig zu bleiben und Marktanteile zu gewinnen.
Die globale Technologie beschleunigt sich
Am 29. Januar, dem ersten Tag des chinesischen Neujahrs 2025, brachte die Alibaba Group eine neue Version des künstlichen Intelligenzmodells (KI) Qwen 2.5 auf den Markt und gab bekannt, dass dieses Modell leistungsfähiger als DeepSeek sei. Laut Alibaba übertrifft Qwen 2.5 die fortschrittlichsten KI-Modelle von OpenAI und Meta (USA) wie GPT-4o und Llama-3.1-405B „in fast jeder Hinsicht“.
Zuvor hatte DeepSeek KI-Assistenten mit den Modellen DeepSeek-V3 und DeepSeek-R1 auf den Markt gebracht, die nur einen Bruchteil der Kosten der Produkte amerikanischer Unternehmen kosteten.
Zwei „Erdbeben“ – DeepSeek und Alibaba – haben in China einen Wettlauf um KI-Upgrades ausgelöst. Der kostengünstige KI-Chatbot ChatGLM wurde von einem Forschungsteam der Tsinghua-Universität und der Zhipu AI Company entwickelt. ChatGLM ist ein Open-Source-KI-Chatbot, der Texte generieren, übersetzen und Fragen beantworten kann.
Auch der Ernie Bot des Technologieriesen Baidu hat eine verbesserte Version, Ernie 4.0 Turbo, auf den Markt gebracht, die verschiedene Aufgaben ausführen kann, darunter Textgenerierung, Übersetzung, Beantwortung von Fragen, Bilderzeugung usw. Inzwischen hat ByteDance – die Muttergesellschaft von TikTok – ihr KI-Flaggschiffmodell aktualisiert und bekannt gegeben, dass es den o1-Test von OpenAI im AIME-Test bestanden hat – einem Standard, der die Fähigkeit von KI misst, komplexe Anweisungen zu verarbeiten und darauf zu reagieren.
DeepSeek bedroht auch den Weltmarkt und zwingt führende Technologiegiganten wie OpenAI, Meta, Google, Microsoft usw., ihre Investitionsstrategien anzupassen. Amerikanische Technologiekonzerne investierten zuvor in KI- und Datenfabriken, müssen sich nun aber auf die Verbesserung von Algorithmen konzentrieren, um Kosten zu senken und schneller und effizienter zu arbeiten. Kürzlich hat OpenAI die Funktion „Deep Research“ eingeführt, die ChatGPT bei der Synthese und Recherche von Informationen unterstützt. Das Highlight dieser Funktion ist die Möglichkeit, Details des Forschungsprozesses anzuzeigen, einschließlich Zitaten und Zusammenfassungen der verwendeten Methoden, sodass Nutzer Informationen leicht verfolgen und überprüfen können.
Auch andere Länder wie Indien und Südkorea beteiligen sich an der Entwicklung kostengünstiger KI-Chatbots. In Indien beispielsweise hat die Reliance Jio Company des Milliardärs Mukesh Ambani den ersten KI-Chatbot namens BharatGPT auf den Markt gebracht, der lokale Sprachen unterstützt. Dies ist ein bedeutender Fortschritt im KI-Bereich in Indien und trägt dazu bei, dass die Technologie auch die nicht englischsprachige Bevölkerung leichter erreicht.
DeepSeek und Qwen 2.5-Schnittstelle Foto: Future/Qwen/Shutterstock
Welche Chancen für Vietnam?
Herr Lu Vincent The Hung, Gründer und CEO der EduX Global Institute Joint Stock Company, sagte, dass die Technologiebranche in der Vergangenheit oft Kosten in Milliardenhöhe für die Entwicklung von KI-Modellen angegeben habe. Die Einführung von R1 durch das Technologie-Start-up DeepSeek für nur 6 Millionen US-Dollar könnte jedoch – sofern dies zutrifft – Ländern und Start-up-Unternehmen den Anstoß geben, ihre eigene leistungsstarke und kostengünstige KI zu entwickeln. Dadurch können Unternehmen, insbesondere kleine und mittlere Unternehmen, ohne allzu hohe Anfangskosten auf KI zugreifen und diese anwenden und die digitale Transformation in den Bereichen Produktion, Handel, Dienstleistungen und Bildung vorantreiben.
Das neu eingeführte R1-Modell von DeepSeek ist jedoch auf zahlreiche Kontroversen im Zusammenhang mit der Datensicherheit und dem Kopieren von KI-Modellen anderer Technologieunternehmen gestoßen. Um kostengünstig eigene KI-Modelle erstellen zu können, müssen Länder und Unternehmen daher die Funktionsprinzipien, Algorithmen, den Quellcode usw. genau verstehen, anstatt sie zu kopieren oder zu stehlen. „Bei einem erfolgreichen KI-Modell geht es nicht nur um die Verarbeitungskapazität, sondern auch um die Kosten. Vietnamesische Unternehmen sollten Lösungen entwickeln, die entsprechend den Anforderungen vieler verschiedener Branchen erweitert und angepasst werden können“, rät Herr Hung.
Laut Phan Tan Quoc, stellvertretender Direktor des KPMG Vietnam Innovation Program, wird der harte Wettbewerb auf dem KI-Markt für vietnamesische Unternehmen sowohl Druck als auch Motivation bedeuten, schnell nützliche und prestigeträchtige Modelle für inländische Nutzer und Kunden zu entwickeln. Herr Quoc empfahl der Regierung, Maßnahmen zu ergreifen, um Unternehmen und Einzelpersonen zu ermutigen, sich an der KI-Entwicklung zu beteiligen, Datenbanken aufzubauen und gleichzeitig Investitionen in KI-Forschungszentren zu unterstützen.
„Der Trend, Open-Source-Code in der KI-Community zu teilen, kann Entwicklern helfen, das Modell zu nutzen und zu verbessern. In der kommenden Zeit werden viele Startups und Einzelpersonen problemlos auf KI zugreifen und sie in ihren Betrieben anwenden können, wenn viele neue KI-Modelle auftauchen, die spezifische Anforderungen erfüllen“, sagte Herr Quoc.
Experten zufolge müssen Unternehmen bei der Entwicklung von KI klar definieren, ob das Modell ein bestimmtes Problem lösen, den Nutzern einen echten Mehrwert bieten und unterschiedliche Funktionen oder herausragende Highlights aufweisen kann. Das Modell von DeepSeek ist ein Vorbild für globale Technologieunternehmen, die zwar selbst sehr niedrige Kosten deklarieren, aber eine Leistung aufweisen, die ChatGPT übertreffen soll. Anschließend ist es notwendig, die Nachfrage nach KI auf dem Markt klar zu verstehen, um sicherzustellen, dass KI wettbewerbsfähig genug ist und Gewinne erwirtschaftet.
Ist DeepSeek wirklich günstig?
In seinem Bericht gab DeepSeek an, dass die Gesamtkosten für das Training des KI-Modells weniger als 6 Millionen US-Dollar betrugen, was hauptsächlich auf die Anmietung von Grafikprozessoren von NVIDIA zurückzuführen sei. Das Halbleiterforschungs- und Beratungsunternehmen SemiAnalysis berechnete jedoch kürzlich, dass die Kosten für die Entwicklung von DeepSeek deutlich höher seien als angegeben.
DeepSeek wird voraussichtlich ein riesiges Computersystem mit rund 50.000 Hopper-GPUs betreiben, darunter 10.000 H800-GPUs, 10.000 leistungsstärkeren H100-GPUs und zusätzlichen H20-GPUs. Die Gesamtinvestitionen für die Server werden auf rund 1,6 Milliarden US-Dollar geschätzt, die Betriebskosten belaufen sich auf rund 944 Millionen US-Dollar.
Quelle: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
Kommentar (0)