
اخیراً، مراسم اعلام نتایج چالش شهر هوش مصنوعی ۲۰۲۵ (هوش مصنوعی در شهرهای هوشمند) در چارچوب کنفرانس بینالمللی بینایی کامپیوتر (ICCV 2025) در هاوایی (ایالات متحده آمریکا) برگزار شد. پس از پیروزی در سال ۲۰۲۴، امسال تیم مهندسی هوش مصنوعی VNPT مقام اول را در دسته پردازش و تشخیص اشیاء از دادههای تصویر دوربین با زاویه دید فوق عریض در دستگاههای لبه (هوش مصنوعی لبه) کسب کرد. این مشکل نیاز به یک سیستم هوش مصنوعی با سرعت پردازش بلادرنگ، مستقیماً بر روی دستگاههای سختافزاری فشرده، دارد که در عین حال دقت بالا در تشخیص اشیاء از دادههای تصویر بسیار تحریفشده را تضمین میکند و نیازهای عملی را برآورده میسازد.
چالش شهر هوش مصنوعی ۲۰۲۵ یکی از معتبرترین مسابقات سالانه جهان در زمینه هوش مصنوعی (AI) به کار رفته در شهرهای هوشمند است. رقابت امسال شامل چهار دسته با پیچیدگی بالاتر از فصلهای گذشته است که بیش از ۳۰،۰۰۰ تیم از کشورهایی با توسعه قوی هوش مصنوعی مانند ایالات متحده، چین، کره، تایوان و غیره را به خود جذب میکند.
تیم مهندسی VNPT به لطف دقت و سرعت پردازش هوش مصنوعی در لبه فناوری، پیشرو است.
چالش افزایش قابلیتهای هوش مصنوعی در لبه فناوری
مسئله پردازش و تشخیص اشیاء از دادههای تصویر دوربین با زاویه دید فوق عریض از سال ۲۰۲۴ در چالش شهر هوش مصنوعی گنجانده شده است که نشان دهنده روند اعمال بینایی کامپیوتر در سیستمهای نظارت بر ترافیک فعلی است. این دسته با کاربردی بودن بالا، همیشه رقابتی با بیشترین تعداد تیم در کل رقابت است. امسال، دشواری این دسته زمانی افزایش مییابد که علاوه بر پردازش دقیق تصاویر تحریف شده و تغییر شکل یافته، تیمها باید کل فرآیند را بهینه کنند تا مدل بتواند به طور مؤثر روی دستگاههای لبهای عمل کند.
تیم مهندسی VNPT تکنیکهای زیادی را برای شناسایی سریع و دقیق وسایل نقلیه به کار میگیرد.
تیمها ملزم بودند مدلهای خود را برای اجرای کارآمد روی Jetson Orin، دستگاه کوچکی که در نقطه جمعآوری دادهها قرار دارد (به نام دستگاه لبه) که دارای محدودیت توان 30 وات و قدرت محاسباتی بسیار پایینتری نسبت به یک سرور مرکزی است، بهینهسازی کنند. این بدان معناست که تیمها نمیتوانند از مدلهای بیش از حد بزرگ استفاده کنند، بلکه باید برنامه را ساده و بهینه کنند تا سریعتر اجرا شود، منابع کمتری مصرف کند و همچنان وسایل نقلیه را به طور دقیق تشخیص دهد. این تغییرات، چالش شهر هوش مصنوعی 2025 را به یکی از دشوارترین فصلها تا به امروز تبدیل کرد، به خصوص که تیمها از تجربه سال گذشته درس گرفتند و سطح رقابت به طور قابل توجهی افزایش یافت.
از تجربه بهینهسازی مدل در دنیای واقعی بهرهمند شوید
در مسائل نظارت بر ترافیک، زیرساختهای محاسباتی و اتصالات شبکه اغلب محدود هستند و همین امر توسعه مدلهای هوش مصنوعی که هم دقیق و هم کارآمد باشند را به یک چالش بزرگ تبدیل میکند. به همین دلیل است که هوش مصنوعی لبهای (Edge AI) به یک روند اجتنابناپذیر تبدیل شده است. به جای ارسال تمام دادهها به یک سرور مرکزی برای پردازش، مدل درست در دستگاه جمعآوری (مانند دوربین) قرار میگیرد و به پاسخگویی سریعتر، کاهش تأخیر، صرفهجویی در پهنای باند و تضمین امنیت دادهها، به ویژه در سیستمهای نظارتی در مقیاس بزرگ، کمک میکند.
طبق نتایج اعلام شده در چالش شهر هوش مصنوعی ۲۰۲۵، تیم مهندسی VNPT با پیشی گرفتن از صدها تیم از شرکتهای بزرگ فناوری، مؤسسات تحقیقاتی و دانشگاههای سراسر جهان، مقام اول را کسب کرد. این دستاورد به تقویت اکوسیستم هوش مصنوعی برای نظارت بر ترافیک و امنیت شهری در کشور کمک میکند، جایی که دوربینهای با زاویه دید فوق عریض به طور گسترده برای گسترش منطقه مشاهده، کاهش نقاط کور، کاهش تعداد دستگاههای نصب شده و بهبود کارایی عملیات زیرساختهای شهری به کار گرفته میشوند. تیم مهندسی VNPT با بیش از هفت سال تجربه در توسعه مدلهای هوش مصنوعی برای پردازش تصویر و استقرار آنها در داخل کشور، توانایی ایجاد تعادل بین دقت، سرعت و هزینههای عملیاتی - عواملی که اثربخشی کاربرد هوش مصنوعی در محیطهای واقعی را تعیین میکنند - را به دست آورده است.

تیم VNPT بیش از ۴۰ مدل هوش مصنوعی پردازش تصویر را توسعه داده و بر آنها تسلط یافته است.
در حال حاضر، تیم VNPT بیش از ۴۰ مدل مختلف هوش مصنوعی پردازش تصویر مانند تشخیص پلاک، اندازهگیری جریان ترافیک، تشخیص کلاه ایمنی و همچنین مدلهای خاص ویتنام مانند تشخیص وسایل نقلیه حامل سه نفر، حمل کالاهای حجیم یا تشخیص آتشسوزی و سلاح در حوزه امنیت و نظارت شهری را توسعه داده و بر آنها تسلط یافته است. این مدلها برای کار بر روی سختافزارهای متنوع، از GPUها، CPUها گرفته تا NPUها، بهینه شدهاند و نیازهای متنوع سیستمها و مشتریان را برآورده میکنند.
برای اینکه بتوان به طور مؤثر در مقیاس بزرگ، به ویژه در مدل داخلی و در لبه شبکه با صدها دوربین به طور همزمان، مستقر شد، مهندسان VNPT روشهای پردازش بهینهای را نیز ایجاد کردهاند که امکان عملکرد همزمان صدها جریان داده ویدیویی را فراهم میکند. این رویکرد، مقیاسپذیری راهحلهای هوش مصنوعی را آسان میکند، در منابع صرفهجویی میکند و برای شرایط زیرساختی در بسیاری از مناطق مناسب است.
با بهکارگیری این تجربه در چالش شهر هوش مصنوعی ۲۰۲۵، این تیم ترکیبی از تکنیکهایی مانند فشردهسازی مدل برای کاهش اندازه و منابع پردازشی، بهینهسازی جریان پردازش تصویر برای کاهش تأخیر و اصلاح زبان برنامهنویسی و ساختار کد را برای تشکیل زنجیره پردازش کلی برای بالاترین عملکرد به کار برد. این رویکرد به مدل کمک میکند تا ضمن افزایش سرعت استنتاج و استقرار در دستگاههای لبهای با محدودیت سختافزاری، دقت را حفظ کند.
پلتفرم تحقیقاتی هوش مصنوعی یادگیری عمیق چند رشتهای
نه تنها داشتن تیمی از کارکنان جوان و با استعداد و زیرساختهای محاسباتی قوی، بلکه یکی از مقدمات مهم برای VNPT جهت داشتن یک اکوسیستم جامع محصول هوش مصنوعی که مطابق با استانداردهای بینالمللی باشد و جوایز بالایی را در مسابقات معتبر کسب کند، پلتفرم تحقیقاتی عمیق هوش مصنوعی در بسیاری از زمینهها است.
در مورد کاربردهای هوش مصنوعی در پردازش تصویر، علاوه بر سیستمهای هوشمند شهری و ترافیکی، VNPT کاربردهای تحقیقاتی در حوزه پزشکی را نیز ترویج میدهد. در سپتامبر 2025، این گروه تحقیقات علمی خود را در MICCAI 2025 - کنفرانس پیشرو جهان در زمینه هوش مصنوعی و بینایی کامپیوتر در پزشکی - اعلام کرد. این تحقیق بر کاربردهای هوش مصنوعی در تشخیص سرطان تیروئید متمرکز بود که با دادههای نزدیک به 10،000 بیمار در 3 منطقه کشور طی 4 سال انجام شد. این پروژه نقش اساسی در توسعه سیستمهای پشتیبانی تشخیصی خودکار مناسب برای ویژگیهای جمعیتی و شرایط پزشکی در کشور دارد و به بهبود دقت، کوتاه شدن زمان تشخیص، کاهش حجم کار پزشکان و گسترش دسترسی به خدمات پزشکی با کیفیت بالا به سطوح پایین جامعه کمک میکند.
تیم مهندسی هوش مصنوعی VNPT تحقیقات خود را در بسیاری از کنفرانسهای علمی معتبر منتشر کرده است.
در زمینه پردازش زبان و گفتار، VNPT همچنین از تحقیقات خود در EMNLP 2025 - یک کنفرانس هوش مصنوعی با رتبه A* در زمینه پردازش زبان طبیعی - و ICASSP 2025 - یک کنفرانس با رتبه A1 در زمینه پردازش گفتار - خبر داد. این کارها از تکنیکهای پیشرفته یادگیری ماشین در توسعه مدلهای زبانی بزرگ (LLM) و هوش مصنوعی مولد استفاده میکنند و هدف آنها بهبود توانایی مدلهای هوش مصنوعی در درک زمینه، احساسات و تفاوتهای ظریف ویتنامی است - که عوامل پیچیدهای هستند و به ندرت در پیکرههای بینالمللی مدلسازی میشوند. به لطف این، زبان ویتنامی به طور فزایندهای در جامعه تحقیقاتی جهانی NLP حضور دارد و امکان ساخت مدلهای زبانی قوی، منحصر به فرد و مناسب برای مردم ویتنام را فراهم میکند.
منبع: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






نظر (0)