Vietnam.vn - Nền tảng quảng bá Việt Nam

هوش مصنوعی تا کجا پیش خواهد رفت؟

در رویداد سالانه هوش مصنوعی زالو، سخنرانان تجربیات خود را در به‌کارگیری هوش مصنوعی در زندگی روزمره به اشتراک گذاشتند و روندهای جدیدی را پیرامون هوش مصنوعی عاملی و هوش مصنوعی فیزیکی پیش‌بینی کردند.

ZNewsZNews20/12/2025

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 1

اجلاس هوش مصنوعی زالو که اولین بار در سال ۲۰۱۷ برگزار شد، رویدادی است که متخصصان مشهور در حوزه هوش مصنوعی را گرد هم می‌آورد. اجلاس هوش مصنوعی زالو ۲۰۲۵ با موضوع «ویتنام در عصر هوش مصنوعی‌سازی»، راهکارهایی برای به‌کارگیری هوش مصنوعی در زندگی روزمره ارائه می‌دهد، روندهای هوش مصنوعی را پیش‌بینی می‌کند و دستاوردهای زالو در نزدیک‌تر کردن هوش مصنوعی به کاربران را به نمایش می‌گذارد.

آقای نگوین مین تو، مدیر فناوری در زالو، در سخنان آغازین خود اظهار داشت که دوران هوش مصنوعی در سال‌های ۲۰۱۸-۲۰۱۹ با اولین مدل‌های ترانسفورماتور آغاز شد. با این حال، تا زمان ظهور GPT-3.5 و ChatGPT در سال ۲۰۲۲، این مدل‌های زبانی به کیفیت بالایی دست نیافتند و برای مخاطبان گسترده‌تری قابل دسترسی شدند.

آقای تو تأکید کرد: «این زمانی بود که دوران هوش مصنوعی آغاز شد، زمانی که مردم شروع به استفاده از ChatGPT کردند.»

سیگنال مثبت برای ویتنام

همچنان که شرکت‌هایی مانند گوگل، آنتروپیک و دیپ‌سیک به طور فزاینده‌ای مدل‌سازی زبان‌های بزرگ (LLM) را بهبود می‌بخشند، بازار هوش مصنوعی شاهد نقطه عطفی به نام هوش مصنوعی عامل‌گرا است.

برخلاف هوش مصنوعی مرسوم که تنها می‌تواند وظایف واحدی را حل کند، هوش مصنوعی عامل‌گرا یک سیستم خودمختار است که قادر به اتصال چندین عامل برای رسیدگی به مسائل پیچیده است.

آقای تو افزود: «هوش مصنوعی عامل مانند کارمندان ما عمل می‌کند. می‌تواند بر اساس دستورات ما تجزیه و تحلیل کند، استدلال کند، وظایف را انجام دهد و گزارش بنویسد.»

در ویتنام، زالو یکی از شرکت‌هایی است که بسیاری از ویژگی‌های هوش مصنوعی را برای خدمت‌رسانی به کاربران ادغام می‌کند. پیش‌بینی می‌شود تا سال ۲۰۲۵، تعداد کاربران این سرویس‌ها به بیش از ۱۷ میلیون نفر برسد که افزایشی بیش از ۲۰۰ درصد را نشان می‌دهد. بیش از ۷.۵ میلیون نفر از ویژگی دیکته (تبدیل گفتار به متن) استفاده می‌کنند.

آقای تو تأکید کرد: «این ویژگی نحوه استفاده بسیاری از افراد از زالو را تغییر داده است. به جای تایپ کردن متن، استفاده از صدا بسیار سریع‌تر و راحت‌تر است.»

قابلیت ترجمه پیام‌ها از ویتنامی به انگلیسی نیز توجه تعداد زیادی از کاربران را به خود جلب کرده است. آقای تو فاش کرد که ترجمه زنده برای تماس‌های Zalo به زودی اضافه خواهد شد.

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 2

آقای نگوین مین تو، مدیر فناوری در Zalo.

هوش مصنوعی فراتر از خدمت‌رسانی به کاربران نهایی، از عملیات زالو نیز پشتیبانی می‌کند. این شرکت یک چت‌بات خدمات مشتری ساخته است که به حل مشکل افزایش مقیاس در دوره‌های اوج کار که استخدام کارکنان اضافی دشوار است، کمک می‌کند.

پس از ۳ ماه اجرا، سیستم چت‌بات در زالو به نرخ پاسخگویی ۹۰ درصد رسید که بالاتر از نرخ پاسخگویی انسان بود. تنها حدود ۲ تا ۳ درصد موارد نیاز به کمک انسانی از طریق چت‌بات داشتند.

نماینده‌ی زالو اذعان کرد که هنوز چالش‌هایی در به‌کارگیری هوش مصنوعی در داخل شرکت، پیرامون حریم خصوصی و امنیت، وجود دارد. به همین دلیل است که این پلتفرم رویکردی انعطاف‌پذیر را انتخاب می‌کند، از یک مدل توسعه‌یافته‌ی خود برای داده‌های حساس استفاده می‌کند و برای داده‌های کم‌اهمیت‌تر از چت‌بات‌های خارجی بهره می‌برد.

آقای تو همچنین به چالش هوش مصنوعی زالو ۲۰۲۵، رقابتی برای توسعه راهکارهای کاربردی هوش مصنوعی در زندگی روزمره، اشاره کرد. علاوه بر جوانان و دانشجویان، رقابت امسال چندین دانش‌آموز دبیرستانی را نیز به خود جذب کرد که برخی از آنها حتی به جمع ۵ نفر برتر راه یافتند.

نماینده زالو تأکید کرد: «این نشان می‌دهد که هوش مصنوعی در تمام حوزه‌های جامعه نفوذ کرده و حتی به مدارسی که کودکان در سنین بسیار پایین در معرض هوش مصنوعی قرار می‌گیرند، گسترش یافته است. این نشانه مثبتی برای ویتنام در دوران «تحول هوش مصنوعی» است.»

موج عوامل هوش مصنوعی

در جلسه اول، دانشیار کوان تان تو از دانشگاه فناوری شهر هوشی مین این سوال را مطرح کرد که چگونه هوش مصنوعی چندوجهی جهان را تغییر خواهد داد. او استدلال کرد که LLM به چرخه پایانی خود رسیده است و روند فناوری به تدریج به سمت سیستم‌های چندعاملی (MAS) در حال تغییر است.

دانشیار دکتر با آقای تو در مورد نقطه عطف مهم LLM با معرفی GPT-3.5 موافقت کرد و اظهار داشت که هدف مشترک چت‌بات‌ها تقلید هرچه دقیق‌تر از انسان‌ها است. مفهوم عامل‌های هوش مصنوعی قبلاً وجود داشته است، اما فقط تحت چارچوب LLM به طور واقعی شکوفا شده است.

آقای تو گفت: «عامل یک معماری نسبتاً کلاسیک است و وقتی با LLM ترکیب شود، امکان ارتباط بین مدل‌ها را فراهم می‌کند.» کلمات کلیدی «عامل‌های هوش مصنوعی» و «هوش مصنوعی عامل» نیز از اواخر سال ۲۰۲۴ تا به امروز جزو پرجستجوترین عبارات در گوگل ترندز بوده‌اند.

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 3

دانشیار دکتر کوان تان تو، رئیس دانشکده علوم و مهندسی کامپیوتر ، دانشگاه فناوری شهر هوشی مین.

دانشیار اظهار داشت که هوش مصنوعی عامل‌محور، سیستمی متشکل از چندین عامل است که با هم کار می‌کنند. پس از دریافت دستور از کاربر، عوامل درخواست را تجزیه می‌کنند، وظایف را تعیین می‌کنند، ابزارهای مناسب را انتخاب می‌کنند و آنها را گام به گام اجرا می‌کنند تا در مقایسه با یک مدل واحد، به کارایی بالاتری دست یابند.

آقای تو همچنین برخی از کاربردهای عملی MAS را در مشاغل داخلی ارائه داد. به طور خاص، نمایندگان هوش مصنوعی می‌توانند همزمان فایل‌های PDF، تصاویر و اسناد را پردازش کنند و کارایی را 40 تا 60 درصد بهبود بخشند. در بخش بیمه، این فناوری به یک شرکت کمک می‌کند تا 20 تا 40 درصد از حجم کار خود را خودکار کند.

علاوه بر این، عوامل هوش مصنوعی توانایی جمع‌آوری اطلاعات در زمان واقعی را دارند و به ارائه قیمت‌های فوری بازار کمک می‌کنند. در محل کار، دانشیار دکتر [نام] اظهار داشت که سیستم عامل هوش مصنوعی به عنوان یک دستیار هوشمند عمل می‌کند و قادر به پاسخگویی به سوالات مربوط به مدرسه برای والدین و دانش‌آموزان است. در آموزش ، عوامل هوش مصنوعی به ایجاد مدل‌های یادگیری شخصی‌سازی شده متناسب با مسیر یادگیری هر دانش‌آموز کمک می‌کنند.

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 4

اجلاس هوش مصنوعی زالو ۲۰۲۵ تعداد زیادی از شرکت‌کنندگان علاقه‌مند به حوزه هوش مصنوعی را به خود جذب کرد.

در مجموع، مزیت MAS در توانایی آن در مدیریت چندین مسئله پیچیده به صورت موازی نهفته است. از طریق فرآیند استدلال، عامل‌ها می‌توانند اطلاعات را به طور مستقل پردازش کنند، از یکدیگر یاد بگیرند و از کاربر یاد بگیرند تا خطاها را کاهش دهند و نتایج دقیق و شخصی‌سازی‌شده تولید کنند.

معماری‌های عامل مدرن اغلب به صورت ابزارها و پلتفرم‌هایی با رابط‌های کاربرپسند ارائه می‌شوند که آنها را برای عموم مردم قابل دسترس‌تر می‌کند.

بر اساس این مزایا، آقای تو بر اهمیت به‌کارگیری فناوری و تنظیم فرآیندهای کاری داخلی در کسب‌وکارها تأکید کرد. به گفته این دانشیار، در چارچوب روند نوآوری قوی که در سراسر جهان در حال وقوع است، این موجی است که کسب‌وکارها باید به آن توجه ویژه‌ای داشته باشند.

بعد از هوش مصنوعی عامل‌گرا چه چیزی می‌آید؟

اخیراً، ربات‌های انسان‌نما به یک روند جذاب در دنیای فناوری تبدیل شده‌اند. این همچنین رایج‌ترین کاربرد هوش مصنوعی فیزیکی است.

دکتر تران مین کوان، تکنسین ارشد توسعه‌دهنده در انویدیا ویتنام، با به اشتراک گذاشتن نظرات خود در مورد این موضوع، تأکید کرد که هوش مصنوعی فیزیکی، پس از دوران هوش مصنوعی مولد یا هوش مصنوعی عامل، پیشرفته‌ترین پیشرفت در روندهای هوش مصنوعی است.

آقای کوان با ارائه مروری بر هوش مصنوعی فیزیکی، گفت: «این مدل‌های هوش مصنوعی قادر به دریافت دستورات یا داده‌های ورودی هستند و سپس اقدامات خاصی را انجام می‌دهند که بر موتورها یا اجزای کنترل ربات‌هایی مانند بازوهای رباتیک، وسایل نقلیه خودران، کارخانه‌ها و غیره تأثیر می‌گذارند.»

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 5

دکتر تران مین کوان از انویدیا بینش‌های خود را در مورد روندهای هوش مصنوعی فیزیکی به اشتراک گذاشت.

به گفته نمایندگان انویدیا، هوش مصنوعی فیزیکی می‌تواند در آینده به یک صنعت تریلیون دلاری تبدیل شود. با توجه به اینکه زیرساخت سخت‌افزاری جهانی فعلی شامل تقریباً ۲ میلیارد دوربین صنعتی، ۱۰ میلیون کارخانه، ۲۰۰۰۰۰ انبار و ۱.۵ میلیارد وسیله نقلیه است، پتانسیل به‌کارگیری هوش مصنوعی فیزیکی بسیار زیاد است، تازه این را هم در نظر بگیرید که میلیاردها ربات انسان‌نما می‌توانند در آینده به کار گرفته شوند.

آقای کوان افزود: «اگر هر دستگاه به یک «مغز» هوش مصنوعی مجهز باشد تا بتواند حجم کار فعلی را مدیریت کند، وظایفی که می‌توانند در مقیاسی بسیار متفاوت از امروز پشتیبانی شوند، قابل انجام خواهند بود.»

نیاز به هوش مصنوعی فیزیکی ناشی از کمبود پرسنل در بسیاری از صنایع است. مشاغل بسیار ماهرانه در محیط‌های سخت، مانند جوشکاری در فضاهای بسته و تاریک، برای انسان‌ها دشوار است.

ربات‌ها اکنون راه‌حلی هستند که هزینه‌های پرسنلی و عملیاتی را متعادل می‌کنند. هزینه‌ها را می‌توان بهینه کرد زیرا ربات‌ها اکنون به جای انجام کارهای تکراری، توانایی یادگیری مستقل وظایف جدید را دارند.

آقای کوان تأکید کرد: «به همین دلیل است که «لحظه» ChatGPT برای رباتیک می‌تواند امسال یا سال آینده فرا برسد.»

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 6

هوش مصنوعی فیزیکی، گام بعدی پس از هوش مصنوعی مولد و هوش مصنوعی عامل‌محور محسوب می‌شود.

برای تحقق این چشم‌انداز، نمایندگان انویدیا مدلی از سه کامپیوتر را پیشنهاد دادند که مربوط به سه مرحله کلیدی در توسعه هوش مصنوعی فیزیکی است.

بر این اساس، مرحله اول بر ایجاد پایه و اساس روی سرور تمرکز دارد. پس از آموزش، مدل می‌تواند در یک محیط شبیه‌سازی قرار گیرد تا در مورد تعاملات علّی بیاموزد و به مدل کمک کند تا رفتار بهتری را در دنیای واقعی توسعه دهد.

شبیه‌سازی به ربات‌ها کمک می‌کند تا اشیاء و نحوه برخورد با آنها را به طور دقیق تشخیص دهند. مهم‌تر از آن، شبیه‌سازی به چندین ربات اجازه می‌دهد تا به طور همزمان با هم کار کنند و سناریوهای برخورد را بدون متحمل شدن هزینه سخت‌افزار دنیای واقعی آزمایش کنند. در نهایت، امکان استقرار مستقیم در سخت‌افزار را فراهم می‌کند.

چالش استقرار هوش مصنوعی در مقیاس بزرگ.

فرآیند «هوش مصنوعی‌سازی» که شامل ادغام فناوری در عملیات روزانه برای بهبود کارایی و پشتیبانی از تصمیم‌گیری است، در سطح جهانی در حال شتاب گرفتن است.

به گفته دکتر چائو تان دوک، مدیر تحقیقات Zalo AI، سرعت هوش مصنوعی در ویتنام از عوامل زیادی ناشی می‌شود که مهم‌ترین آنها توسعه مدل‌های هوش مصنوعی، بهبود سریع سخت‌افزار و زیرساخت‌های داده و فرآیند تحول دیجیتال است.

ویتنام یکی از کشورهایی با پتانسیل قابل توجه برای توسعه هوش مصنوعی محسوب می‌شود، همانطور که از برنامه‌های جذب استعداد، ایجاد یک جامعه فناوری و حمایت دولت مشهود است. علاوه بر این، شهروندان ویتنامی از آمادگی بالایی برای تحول دیجیتال برخوردارند.

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 7

دکتر چائو تان دوک، مدیر تحقیقات در Zalo AI.

در این تحول، زالو بسیاری از ویژگی‌های مرتبط با هوش مصنوعی مانند دستیار مجازی کیکی را راه‌اندازی کرد. این شرکت قصد دارد ابزارهایی را توسعه دهد که بهره‌وری کار را افزایش دهند و استفاده از آنها برای همه آسان باشد. ابزارهای زالو از همه چیز، از کدنویسی، برنامه‌نویسی و تحقیق گرفته تا فعالیت‌های روزمره مانند ارتباطات، ترجمه و جستجوی تصویر، پشتیبانی می‌کنند.

با این حال، کارشناسان معتقدند که این تنها آغاز راه است و هنوز مشکلات زیادی در فرآیند تحول هوش مصنوعی وجود دارد. دکتر نگوین ترونگ سون، مدیر علوم در Zalo AI، گفت که این مشکلات ناشی از امنیت، مسائل هزینه و تقاضای بالای کاربران است. اینها نه تنها برای Zalo، بلکه برای کاربران و مشاغل نیز مشکلاتی ایجاد می‌کنند.

اولین مانع حول انتخاب مدل هوش مصنوعی می‌چرخد که سطح مشخصی از استقلال را تضمین کند. مدل‌های شخص ثالث اغلب عملکرد و کیفیت خروجی بهتری ارائه می‌دهند، در حالی که مدل‌های داخلی از مزیت کنترل اطلاعات برخوردارند اما از نظر پایداری و کارایی محدود هستند.

علاوه بر این، اکثر مدل‌های فعلی نقاط ضعف مشترکی مانند دقت ناقص و خروجی متناقض دارند. بسیاری از چت‌بات‌ها توانایی محدودی در درک و پردازش زبان ویتنامی دارند و نمی‌توانند الزامات یا زمینه‌های خاص را برآورده کنند.

برای رسیدگی به این مشکل، متخصصان Zalo چندین راه‌حل ارائه دادند، مانند استفاده از فناوری پیشرفته توسعه مدل و ترکیب منابع داده قابل اعتماد در طول آموزش چت‌بات. همزمان، تیم توسعه به طور مداوم مدل را از طریق آزمایش‌های داخلی ارزیابی می‌کرد.

چالش دیگر، ایجاد تعادل بین هزینه، عملکرد و امنیت است. به گفته دکتر نگوین ترونگ سان، استفاده از یک مدل کوچک برای رسیدگی به درخواست‌های پیچیده می‌تواند زمان پردازش و هزینه‌های عملیاتی را افزایش دهد و برعکس.

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 12

دکتر Nguyen Truong Son، مدیر علوم Zalo AI.

او استدلال کرد که بهینه‌سازی می‌تواند درست از مرحله‌ی ورودی دستور شروع شود. کاربران می‌توانند با محدود کردن طول غیرضروری و ارائه‌ی زمینه‌ای واضح و مختصر برای چت‌بات، هزینه‌های توکن را کاهش دهند.

در سطح سیستم، تیم زالو راهکارهای مختلفی مانند پیشنهاد دستورات مناسب و استقرار لایه‌های کنترل را برای اطمینان از ایمنی و امنیت اطلاعات کاربر پیاده‌سازی می‌کند.

در مجموع، ویتنام برای موج جهانی هوش مصنوعی به خوبی آماده در نظر گرفته می‌شود. زالو یکی از اولین شرکت‌کنندگان در این تحول است که بر پرداختن به چالش‌های هزینه، کیفیت و امنیت هنگام استقرار هوش مصنوعی در مقیاس بزرگ تمرکز دارد.

مسابقه شدید چیپ‌ها

انفجار هوش مصنوعی نتیجه پیشرفت در سخت‌افزار یا تراشه‌ها است. دکتر فام های هیو از OpenAI تأکید می‌کند که ظهور ChatGPT تراشه‌ها را متحول کرد و به انویدیا این امکان را داد که در مدت زمان کوتاهی به سرعت رشد کند.

وقتی ChatGPT برای اولین بار راه‌اندازی شد، تقریباً به‌طور کامل به تراشه‌های انویدیا متکی بود. این امر منجر به افزایش خرید سخت‌افزار از غول‌های فناوری مانند Anthropic و Meta شد.

با این حال، این بازی فقط برای انویدیا نیست. رقبایی مانند AMD و گوگل نیز راه‌حل‌های سخت‌افزاری بهینه‌ای را برای توسعه‌دهندگان مدل‌سازی هوش مصنوعی ارائه می‌دهند.

جریان تراشه‌ها و سرمایه مرتبط با تراشه‌ها نیز بر جریان‌های اقتصادی، حداقل بر رشد اقتصاد ایالات متحده، تأثیر می‌گذارد.

آقای هیو افزود: «علاوه بر این، شرکت‌هایی که مشتاق توسعه هوش مصنوعی هستند، آرزوی توسعه تراشه‌های خود را نیز دارند، زیرا هزینه خرید تراشه‌ها در حال افزایش است، بنابراین حتی یک صرفه‌جویی کوچک نیز سود بزرگی است. به همین دلیل است که هر شرکتی می‌خواهد در منابع تراشه خودکفا باشد.»

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 13

دکتر فام هی هیو، نماینده OpenAI.

بازار تراشه‌های هوش مصنوعی در حال حاضر بر اساس کاربرد مورد نظرشان به دو دسته اصلی تقسیم می‌شود. دسته اول تراشه‌های آموزشی هستند که به توانایی انجام ضرب ماتریس‌های بزرگ، ابعاد یکنواخت و پهنای باند بالا برای اتصال همزمان هزاران تراشه نیاز دارند.

نوع دوم، تراشه استنتاج است که به تعداد کمتری لینک (حدود ۵۰ تا ۱۰۰ تراشه) نیاز دارد و بر روی مسائل ماتریسی کوچک و با اندازه نامنظم تمرکز دارد. با این حال، تراشه‌های استنتاج برای عملکرد پایدار به بهینه‌سازی خوب توان نیاز دارند.

با نگاهی به تاریخچه توسعه، اگر دوره زمانی ۲۰۱۹ تا ۲۰۲۳ بر آموزش و فشرده‌سازی داده‌ها برای مدل‌های GPT متمرکز بود، از سال ۲۰۲۴ به بعد، تمرکز به سمت قابلیت‌های استدلال تغییر می‌کند. این تغییر منجر به تقاضا برای تراشه‌های استنتاج می‌شود.

آقای هیو گفت: «ویتنام چه نقشی در بازی تولید تراشه ایفا می‌کند؟ اگرچه صنعت تراشه یک صنعت تریلیون دلاری است، اما ما برای مشارکت به ده‌ها میلیارد دلار نیاز نداریم. مردم ویتنام می‌توانند از بسیاری جهات در چشم‌انداز تراشه‌های هوش مصنوعی مشارکت کنند.»

Zalo AI Summit 2025,  su kien Zalo AI,  xu huong AI 2026,  agent AI la ai,  agentic AI la gi anh 14

بینش‌هایی از دکتر فام های هیو در مورد سخت‌افزار در زیرساخت هوش مصنوعی.

نمایندگان OpenAI دو مسیر اصلی را پیشنهاد دادند. ویتنام به جای رقابت برای تولید تراشه برای مدل‌های زبانی در مقیاس بزرگ، می‌تواند بر توسعه تراشه‌های کم‌مصرف برای خودروها، تلفن‌های هوشمند یا دستگاه‌های پزشکی قابل کاشت تمرکز کند. اینها بخش‌هایی از بازار با پتانسیل رشد قابل توجه و هزینه‌های سرمایه‌گذاری پایین‌تر هستند.

دوم، ادغام سخت‌افزار و نرم‌افزار است. مشارکت‌هایی مانند الگوریتم Flash Attention 2 نشان می‌دهد که چگونه ترکیب هوشمندانه برنامه‌نویسی و سخت‌افزار می‌تواند بدون نیاز به سرمایه‌گذاری کلان، پیشرفت‌های چشمگیری ایجاد کند.

آقای هیو در پایان گفت: «آینده در دستان کسانی است که جرات دیدن فرصت‌ها، جرات ریسک کردن و جرات رویارویی با خطرات را دارند.»

تیم‌های برجسته در چالش هوش مصنوعی زالو ۲۰۲۵

پس از ارائه سخنرانان، راهکارهای عملی بسیاری برای به‌کارگیری هوش مصنوعی در چالش هوش مصنوعی زالو ۲۰۲۵ ارائه شد. این رقابت که در اواخر اکتبر آغاز شد، بیش از ۱۰۰۰ تیم شرکت‌کننده را به خود جذب کرد.

امسال، چالش هوش مصنوعی Zalo به دو دسته تقسیم می‌شود: RoadBuddy (استفاده از الگوریتم‌ها برای شناسایی علائم راهنمایی و رانندگی) و AeroEyes (طراحی هوش مصنوعی برای پهپادها جهت تشخیص اشیاء زمینی). تیم‌های برنده در مجموع ۱۲۰۰۰ دلار جایزه نقدی به همراه هدایایی از حامیان مالی دریافت خواهند کرد.

به گفته برگزارکنندگان، سوالات امتحان امسال همگی کاربردی بودند و پتانسیل هوش مصنوعی را در خارج از محیط‌های تحقیقاتی برای حل مسائل دنیای واقعی به نمایش گذاشتند.

در چالش RoadBuddy، شرکت‌کنندگان بر پردازش داده‌ها از دوربین‌های داشبورد خودرو تمرکز داشتند. تیم‌ها باید مجموعه داده‌های ویدیویی با مدت زمان ۰ تا ۱۵ ثانیه را که در شرایط زمانی مختلف ضبط شده بودند، پردازش می‌کردند. وظیفه مدل هوش مصنوعی، شناسایی دقیق جزئیاتی مانند علائم جاده، چراغ‌های راهنمایی و علائم خطوط جاده بود که در ویدیو ظاهر می‌شدند.

با مجموعه داده‌ای شامل ۱۵۰۰ نمونه آموزشی، ۵۰۰ نمونه آزمایشی عمومی و ۵۰۰ نمونه آزمایشی خصوصی، تیم‌های رقیب بر اساس دو معیار ارزیابی شدند: دقت و زمان پاسخگویی.

طبق ارزیابی آقای نگوین ترونگ سون، شرکت‌کنندگان از تکنیک‌های پیشرفته‌ای مانند مدل زبان بینایی (VLM) استفاده کردند. فرآیند کلی شامل استخراج فریم‌ها از ویدیو به عنوان داده‌های ورودی و سپس ترکیب آنها با مدل‌هایی مانند Qwen یا YOLO برای شناسایی اشیاء و ارائه تحلیل منطقی است.

در نتایج نهایی، تیم CtelAI با نرخ دقت ۷۱.۳ درصد مقام اول را کسب کرد و پس از آن BitterSweet با ۷۰.۵ درصد قرار گرفت.

با موضوع AeroEyes، تیم‌ها قبل از راهیابی به فینال، در یک دور مقدماتی شرکت کردند. در فینال، داوطلبان باید مدل‌ها را مستقیماً روی پهپادها برنامه‌ریزی می‌کردند، مسیرهای پرواز را تعیین می‌کردند و دوربین‌ها را در شرایط دنیای واقعی برای تشخیص اشیاء کنترل می‌کردند.

با توجه به دشواری تکلیف، تعداد تیم‌هایی که الزامات را برآورده می‌کردند زیاد نبود، بنابراین برگزارکنندگان با انعطاف‌پذیری یک موضوع تکمیلی را معرفی کردند. تیم‌های رقیب به سرعت مدل‌های خود را برای برآورده کردن الزامات تنظیم کردند. در نتیجه، تیم AIO_C3A به لطف بالاترین راندمان خود برنده شد. تیم‌های IUH_Alers_K16 و AEB مقام دوم را به طور مشترک کسب کردند.

منبع: https://znews.vn/ai-se-di-xa-den-dau-post1613033.html


نظر (0)

لطفاً نظر دهید تا احساسات خود را با ما به اشتراک بگذارید!

در همان دسته‌بندی

از همان نویسنده

میراث

شکل

کسب و کارها

امور جاری

نظام سیاسی

محلی

محصول

Happy Vietnam
زود برو بازار.

زود برو بازار.

گیاهان آپارتمانی اکسیژن تولید می‌کنند.

گیاهان آپارتمانی اکسیژن تولید می‌کنند.

فصل برداشت برنج در Ban Phung، Hoang Su Phi

فصل برداشت برنج در Ban Phung، Hoang Su Phi