پس از تب و تاب DeepSeek، شرکتهای بزرگ فناوری چینی به سرعت برای راهاندازی مدلهای زبانی بزرگ (LLM) برای رقابت و به دست آوردن سهم بازار، به رقابت پرداختند.
فناوری جهانی شتاب میگیرد
در ۲۹ ژانویه، اولین روز از سال نو قمری ۲۰۲۵، گروه علیبابا نسخه جدیدی از مدل هوش مصنوعی (AI) Qwen 2.5 را راهاندازی و اعلام کرد که این مدل از DeepSeek قدرتمندتر است. به گفته علیبابا، Qwen 2.5 "تقریباً از هر نظر" از پیشرفتهترین مدلهای هوش مصنوعی OpenAI و Meta (USA) مانند GPT-4o و Llama-3.1-405B پیشی میگیرد.
پیش از این، DeepSeek دستیارهای هوش مصنوعی را با استفاده از مدلهای DeepSeek-V3 و DeepSeek-R1 با قیمتی تنها کسری از محصولات شرکتهای آمریکایی عرضه کرده بود.
دو «زلزله» یعنی DeepSeek و Alibaba درست در چین یک مسابقه ارتقاء هوش مصنوعی ایجاد کردهاند. نکته قابل توجه این است که چتبات هوش مصنوعی کمهزینه ChatGLM توسط یک تیم تحقیقاتی از دانشگاه Tsinghua و شرکت Zhipu AI توسعه داده شده است. ChatGLM یک چتبات هوش مصنوعی متنباز است که قادر به تولید متن، ترجمه و پاسخ به سوالات است.
غول فناوری بایدو، ارنی بات، همچنین نسخهای ارتقا یافته به نام ارنی ۴.۰ توربو را عرضه کرد که قادر به انجام وظایف مختلفی از جمله تولید متن، ترجمه، پاسخ به سوال، ایجاد تصویر و غیره است. در همین حال، بایتدنس - شرکت مادر تیکتاک - مدل هوش مصنوعی پرچمدار خود را بهروزرسانی کرد و اعلام کرد که در آزمون AIME - استانداردی که توانایی هوش مصنوعی در پردازش و پاسخ به دستورالعملهای پیچیده را اندازهگیری میکند - نمره o1 از OpenAI را کسب کرده است.
DeepSeek همچنین بازار جهانی را تهدید میکند و غولهای فناوری پیشرو مانند OpenAI، Meta، Google، Microsoft و... را مجبور به تنظیم استراتژیهای سرمایهگذاری خود میکند. شرکتهای فناوری آمریکایی پیش از این در کارخانههای هوش مصنوعی و کارخانههای داده سرمایهگذاری میکردند، اما از این پس، باید بر بهبود الگوریتمها تمرکز کنند تا هزینهها را کاهش دهند و سریعتر و کارآمدتر عمل کنند. اخیراً، OpenAI ویژگی Deep Research را معرفی کرده است که به ChatGPT در ترکیب و تحقیق اطلاعات کمک میکند. نکته برجسته این ویژگی، توانایی نمایش جزئیات فرآیند تحقیق، از جمله استنادها و خلاصه روشهای استفاده شده است که ردیابی و تأیید اطلاعات را برای کاربران آسان میکند.
برخی کشورهای دیگر مانند هند، کره جنوبی و... نیز در توسعه چتباتهای هوش مصنوعی کمهزینه مشارکت دارند. به عنوان مثال، در هند، شرکت Reliance Jio متعلق به میلیاردر موکش آمبانی، اولین چتبات هوش مصنوعی را که از زبانهای محلی پشتیبانی میکند، به نام BharatGPT راهاندازی کرد. این یک گام مهم رو به جلو در حوزه هوش مصنوعی در هند است و به فناوری کمک میکند تا راحتتر به جمعیت غیرانگلیسیزبان دسترسی پیدا کند.
رابط کاربری DeepSeek و Qwen 2.5 عکس: Future/Qwen/Shutterstock
چه فرصتهایی برای ویتنام وجود دارد؟
آقای لو وینسنت دِ هانگ - بنیانگذار و مدیرعامل شرکت سهامی عام موسسه جهانی EduX - گفت که در گذشته، صنعت فناوری اغلب هزینه ساخت مدلهای هوش مصنوعی را تا میلیاردها دلار اعلام میکرد. با این حال، راهاندازی R1 توسط استارتاپ فناوری DeepSeek با هزینه تنها 6 میلیون دلار - در صورت صحت - میتواند نیروی محرکهای برای کشورها و شرکتهای نوپا باشد تا هوش مصنوعی خود را با عملکرد بالا و هزینه کم توسعه دهند. از آنجا، مشاغل، به ویژه شرکتهای کوچک و متوسط، میتوانند بدون نیاز به سرمایهگذاری اولیه زیاد، به هوش مصنوعی دسترسی پیدا کرده و آن را به کار گیرند. تحول دیجیتال را در زمینههای تولید، تجارت، خدمات، آموزش و ... ارتقا دهند.
با این حال، مدل R1 که به تازگی توسط DeepSeek عرضه شده است، با جنجالهای زیادی در رابطه با امنیت دادهها و کپی کردن مدلهای هوش مصنوعی سایر شرکتهای فناوری مواجه شده است. بنابراین، برای ایجاد مدلهای هوش مصنوعی خود با هزینه کم، کشورها و مشاغل باید به جای کپی کردن یا سرقت، اصول عملیاتی، الگوریتمها، کد منبع و غیره را به دقت درک کنند. آقای هونگ پیشنهاد داد: «یک مدل هوش مصنوعی موفق نه تنها در مورد ظرفیت پردازش، بلکه در مورد هزینه نیز هست. مشاغل ویتنامی باید مسیر ساخت راهحلهایی را دنبال کنند که بتوانند مطابق با الزامات صنایع مختلف گسترش یافته و سفارشی شوند.»
به گفته آقای فان تان کواک - معاون مدیر برنامه نوآوری KPMG ویتنام، رقابت شدید در بازار هوش مصنوعی، هم فشار و هم انگیزهای برای شرکتهای ویتنامی خواهد بود تا به سرعت مدلهای مفید و معتبری را برای خدمت به کاربران و مشتریان داخلی ایجاد کنند. آقای کواک توصیه کرد که دولت سیاستهایی برای تشویق شرکتها و افراد به مشارکت در توسعه هوش مصنوعی، ایجاد پایگاههای داده و در عین حال حمایت از سرمایهگذاری در مراکز تحقیقاتی هوش مصنوعی داشته باشد.
آقای کواک گفت: «روند اشتراکگذاری کد منبع باز در جامعه هوش مصنوعی میتواند به توسعهدهندگان کمک کند تا از این مدل بهره ببرند و آن را بهبود بخشند. در آینده، بسیاری از استارتآپها و افراد به راحتی به هوش مصنوعی دسترسی خواهند داشت و آن را در عملیات خود به کار خواهند گرفت، زمانی که مدلهای جدید هوش مصنوعی ظاهر شوند و نیازهای خاص را برآورده کنند.»
به گفته کارشناسان، هنگام توسعه هوش مصنوعی، کسبوکارها باید به وضوح مشخص کنند که آیا این مدل میتواند یک مشکل خاص را حل کند، ارزش واقعی برای کاربران به ارمغان بیاورد و آیا در ویژگیها یا نکات برجسته تفاوتهایی دارد یا خیر. مدل DeepSeek درسی برای شرکتهای فناوری جهانی است که هزینههای خوداظهاری را در سطوح بسیار پایین اعلام میکنند اما گفته میشود عملکرد آنها از ChatGPT فراتر میرود. در مرحله بعد، لازم است تقاضای هوش مصنوعی در بازار به وضوح درک شود تا اطمینان حاصل شود که هوش مصنوعی به اندازه کافی رقابتی است و میتواند سودآور باشد.
آیا DeepSeek واقعاً ارزان است؟
دیپسیک در گزارش خود اعلام کرد که کل هزینه آموزش مدل هوش مصنوعی کمتر از ۶ میلیون دلار بوده است که عمدتاً به دلیل اجاره واحدهای پردازش گرافیکی از انویدیا بوده است. با این حال، اخیراً، شرکت تحقیقات و مشاوره نیمههادی SemiAnalysis هزینه توسعه دیپسیک را بسیار بیشتر از آنچه اعلام شده محاسبه کرده است.
تخمین زده میشود که DeepSeek یک سیستم محاسباتی عظیم متشکل از حدود ۵۰،۰۰۰ پردازنده گرافیکی Hopper، به همراه ۱۰،۰۰۰ پردازنده گرافیکی H800 و ۱۰،۰۰۰ پردازنده گرافیکی قدرتمندتر H100، به همراه پردازندههای گرافیکی اضافی H20 را اداره کند. کل هزینه سرمایه برای سرورها حدود ۱.۶ میلیارد دلار و هزینههای عملیاتی حدود ۹۴۴ میلیون دلار تخمین زده میشود.
منبع: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
نظر (0)