همین چند سال پیش، چین تصور می‌کرد که سرانجام با بهره‌گیری از گنجینه عظیم داده‌های کشور برای توسعه برنامه‌هایی مانند تشخیص چهره، بر رقابت جهانی هوش مصنوعی مسلط خواهد شد.

پیشرفت‌های اخیر در هوش مصنوعی مولد - با استفاده از مدل‌های بزرگ برای تولید محتوا مانند متن، تصاویر و ویدیو - موازنه را تغییر داده و چین را بار دیگر عقب‌مانده نشان داده است.

عرضه Sora در ۱۶ فوریه در حالی صورت می‌گیرد که چین به دلیل تشدید محدودیت‌های صادراتی ایالات متحده، با چالش فزاینده‌ای در زمینه قطع دسترسی به واحدهای پردازش گرافیکی پیشرفته (GPU) انویدیا مواجه است. بهترین بازیگران هوش مصنوعی این کشور چندین سال از همتایان خارجی خود عقب مانده‌اند.

ییکای در ۲۳ فوریه گزارش داد که ژو هونگی، بنیانگذار شرکت امنیت اینترنتی ۳۶۰ Security Technology، سورا را «سطل آب سردی که روی چین ریخته شد» نامید. او گفت که این موضوع به بسیاری از مردم کمک کرد تا شکاف بین خود و رهبران جهان را ببینند.

OpenAI هنوز Sora را به صورت عمومی منتشر نکرده است. این نرم‌افزار مانند برخی از نرم‌افزارهای قبلی متن‌باز نیست. فقط تعداد محدودی از افراد به نسخه آزمایشی Sora دسترسی دارند.

w9xz2qt5.png
سورا از OpenAI به شرکت‌های فناوری چینی کمک می‌کند تا شکاف بین خود و فناوری‌های پیشرو هوش مصنوعی در جهان را درک کنند. (عکس: SCMP)

در چین، اداره ملی فضای مجازی از همه مدل‌های زبان بزرگ عمومی (LLM) می‌خواهد که در دولت ثبت شوند. غول‌های جهانی مانند OpenAI و گوگل هنوز رسماً خدماتی را در اینجا ارائه نداده‌اند.

این غیبت منجر به رقابت بسیاری از غول‌های فناوری داخلی برای کسب جایگاه در بازار با بیش از ۲۰۰ شرکت LLM شده است. بایدو، تنسنت و علی‌بابا همگی شرکت‌های LLM خود را معرفی کرده‌اند.

با این حال، ابزارهای کمی می‌توانند با Sora مقایسه شوند، تا حدودی به این دلیل که هنوز از معماری جدید Diffusion Transformer (DiT) استفاده نمی‌کنند. شرکت مادر TikTok، ByteDance، گفت که ابزار کنترل حرکت ویدیوی داخلی‌اش، Boximator، که برای پشتیبانی از ساخت ویدیو استفاده می‌شود، هنوز در مراحل ابتدایی خود است و برای انتشار انبوه آماده نیست.

این شرکت اذعان می‌کند که از نظر کیفیت تصویر، دقت و مدت زمان، شکاف بزرگی بین Boximator و مدل‌های پیشرو در زمینه ساخت ویدیو وجود دارد.

برخی در این صنعت، به جای مقابله با سورا، مسئله‌ی مهم‌تر را دسترسی به مدل‌های OpenAI می‌دانند. اما قانون‌گذاران آمریکایی به دنبال محدود کردن دسترسی چین به سرویس‌های ابری هوش مصنوعی خود هستند.

یک توسعه‌دهنده چینی که نامش فاش نشده به SCMP گفت که یک مسیر ممکن برای مهندسان هوش مصنوعی چینی این است که «ابتدا Sora را رمزگشایی کرده و آن را با داده‌های خود آموزش دهند تا محصولی مشابه ایجاد کنند.» شو لیانگ، یک کارآفرین هوش مصنوعی مستقر در هانگژو، معتقد است که چین به زودی خدمات مشابهی خواهد داشت، اگرچه ممکن است هنوز شکاف کمی بین محصولات چینی و Sora وجود داشته باشد.

وانگ شوی، استاد متخصص هوش مصنوعی و یادگیری ماشین در دانشگاه تیانجین نرمال (TJNU)، اظهار داشت: تجربه توسعه دوره‌های LLM در طول سال گذشته به شرکت‌های بزرگ فناوری چینی اجازه داده است تا دانش خود را در این زمینه افزایش دهند و سخت‌افزار لازم را ذخیره کنند و این امر آنها را قادر می‌سازد تا در 6 ماه آینده محصولاتی مانند Sora تولید کنند.

چند ماه قبل از عرضه Sora، گروهی از محققان VBench، ابزاری برای سنجش مدل‌های تولید ویدیو، را منتشر کردند. تیم VBench که شامل محققانی از دانشگاه فنی نانیانگ سنگاپور و آزمایشگاه هوش مصنوعی شانگهای در چین بود، بر اساس دموهای ارائه شده توسط OpenAI، دریافتند که Sora از نظر کیفیت کلی ویدیو از سایر مدل‌ها بهتر عمل می‌کند.

لو یانکسیا، مدیر تحقیقات فناوری‌های نوظهور IDC چین، گفت غول‌های فناوری مانند بایدو، علی‌بابا و تنسنت از اولین شرکت‌هایی خواهند بود که خدمات مشابهی را در این کشور ارائه می‌دهند.

او گفت علاوه بر این، آی‌فلای‌تک، سنس‌تایم و هایک‌ویژن - که همگی در فهرست تحریم‌های واشنگتن قرار دارند - نیز به این رقابت خواهند پیوست.

اما به گفته تحلیلگران، چین هنوز با چالش سختی روبرو است، زیرا بازار فناوری آن به طور فزاینده‌ای از نظر سرمایه، سخت‌افزار، داده‌ها و حتی نیروی انسانی از جهان منزوی می‌شود.

شکاف ارزش بازار بین شرکت‌های برتر فناوری چین و شرکت‌های آمریکایی مانند مایکروسافت، گوگل و انویدیا در سال‌های اخیر با تشدید کنترل پکن، به طور قابل توجهی افزایش یافته است.

علاوه بر این، در حالی که زمانی چین از نظر کمیت داده‌ها دارای مزیت تلقی می‌شد، آقای لو خاطرنشان کرد که این کشور اکنون با کمبود داده‌های باکیفیت مورد نیاز برای آموزش مدل‌های جدیدتر، همراه با چالش دسترسی محدود به تراشه‌های پیشرفته، مواجه است.

به گفته مدیران IDC، کمبود استعداد یکی دیگر از نگرانی‌هاست، زیرا بهترین و درخشان‌ترین افراد در هوش مصنوعی اغلب با کار کردن برای بازیگران پیشرو در ایالات متحده، دوران بهتری را سپری می‌کنند. به عنوان مثال، در OpenAI، متخصصان فناوری از چین یک گروه اصلی را تشکیل می‌دهند. از 1677 عضو لینکدین OpenAI، 23 نفر در دانشگاه Tsinghua تحصیل کرده‌اند.

با این حال، حتی با وجود استعدادهای کافی، کارشناسان این سوال را مطرح می‌کنند که هوش مصنوعی بومی چین تا چه حد می‌تواند در مواجهه با محدودیت‌های موجود ناشی از تنش‌های تجاری ایالات متحده و چین پیش برود.

در گزارشی، شرکت پینگ آن سکیوریتیز هشدار داد که تلاش‌های مداوم برای محدود کردن صادرات تراشه از ایالات متحده می‌تواند بلوغ صنعت تراشه هوش مصنوعی چین را تسریع کند، اما «جایگزین‌های داخلی ممکن است انتظارات را برآورده نکنند.»

واشنگتن مانع دسترسی شرکت‌های چینی به پیشرفته‌ترین نیمه‌هادی‌های جهان شده است. در اکتبر ۲۰۲۳، ایالات متحده دوباره مقررات را تشدید کرد و دسترسی سرزمین اصلی به پردازنده‌های گرافیکی (GPU) را که انویدیا به‌طور خاص برای مشتریان چینی طراحی کرده بود تا از محدودیت‌های قبلی اجتناب کند، مسدود کرد.

الکساندر هاروول، تحلیلگر محاسبات پیشرفته در گروه تحقیقات و مشاوره فناوری Omdia، خاطرنشان می‌کند که چین گزینه‌های دیگری غیر از GPU برای آموزش LLM دارد، مانند TPU گوگل، Ascend هواوی، Trainium AWS یا یکی از پیشنهادات تعدادی از استارت‌آپ‌ها. با این حال، این امر به تلاش بیشتری در توسعه نرم‌افزار و مدیریت سیستم نیاز دارد.

به گفته کارآفرین شو، بازار چین با انتشار گزارش‌های فنی در مورد سورا و مدل ویدیویی متن‌باز، فرصت‌های ویژه‌ای خواهد داشت. او گفت: «پلتفرمی برای شرکت‌های چینی وجود خواهد داشت تا از آن بیاموزند.» او افزود که مدل‌های ویدیویی محلی نیز از چینی‌ها بهتر پشتیبانی می‌کنند.

(طبق گزارش SCMP)