تصویر درس ۹۰.png
اپلیکیشن هوش مصنوعی از تشخیص تصاویر پزشکی پشتیبانی می‌کند. عکس: Midjourney

حاشیه‌نویسی نواحی مورد نظر در تصاویر پزشکی، فرآیندی که به عنوان قطعه‌بندی شناخته می‌شود، اغلب اولین گامی است که محققان بالینی هنگام انجام یک مطالعه جدید شامل تصویربرداری زیست‌پزشکی برمی‌دارند.

برای مثال، برای تعیین اینکه اندازه هیپوکامپ بیمار با افزایش سن چگونه تغییر می‌کند، دانشمندان باید هر هیپوکامپ را در یک سری اسکن مغزی نقشه‌برداری کنند. با توجه به ساختارها و انواع تصویربرداری‌های متعدد، این اغلب یک فرآیند دستی زمان‌بر است، به خصوص زمانی که مناطق مورد نظر به خوبی مشخص نشده باشند.

برای ساده‌سازی این فرآیند، محققان MIT یک سیستم مبتنی بر هوش مصنوعی توسعه داده‌اند که به دانشمندان اجازه می‌دهد تا با کلیک کردن، خط خطی کردن یا کشیدن کادر روی تصاویر، به سرعت مجموعه داده‌های تصویربرداری زیست‌پزشکی جدید را بخش‌بندی کنند. مدل هوش مصنوعی از این تعاملات برای پیش‌بینی بخش‌بندی استفاده می‌کند.

هرچه کاربر تصاویر بیشتری را برچسب‌گذاری کند، تعداد تعاملات مورد نیاز کاهش می‌یابد و در نهایت به صفر می‌رسد. سپس مدل می‌تواند تصاویر جدید را بدون هیچ ورودی اضافی از سوی کاربر، به طور دقیق بخش‌بندی کند.

این امر امکان‌پذیر است زیرا معماری مدل به طور خاص برای بهره‌گیری از اطلاعات تصاویر قبلاً بخش‌بندی شده جهت پیش‌بینی تصاویر بعدی طراحی شده است. برخلاف سایر مدل‌های بخش‌بندی تصاویر پزشکی، این سیستم به کاربران اجازه می‌دهد تا کل مجموعه داده‌ها را بدون نیاز به تکرار کار برای هر تصویر، بخش‌بندی کنند.

علاوه بر این، این ابزار تعاملی نیازی به مجموعه داده‌های از پیش قطعه‌بندی‌شده برای آموزش ندارد، بنابراین کاربران به تخصص یادگیری ماشین یا منابع محاسباتی پیچیده نیاز ندارند. آن‌ها می‌توانند بدون نیاز به آموزش مجدد مدل، از سیستم برای یک کار قطعه‌بندی جدید استفاده کنند.

در درازمدت، این ابزار می‌تواند تحقیقات در مورد درمان‌های جدید را تسریع کند و هزینه‌های آزمایش‌های بالینی و تحقیقات پزشکی را کاهش دهد. همچنین می‌تواند توسط پزشکان برای بهبود کارایی کاربردهای بالینی، مانند برنامه‌ریزی درمان با پرتودرمانی، مورد استفاده قرار گیرد.

هالی وانگ، دانشجوی دکترای مهندسی برق و علوم کامپیوتر و نویسنده اصلی مقاله‌ای که این مدل را معرفی می‌کند، گفت: «بسیاری از دانشمندان ممکن است فقط بتوانند روزانه چند تصویر را برای تحقیقات خود بخش‌بندی کنند، زیرا بخش‌بندی دستی بسیار زمان‌بر است. ما امیدواریم که این سیستم با فراهم کردن امکان انجام مطالعاتی که محققان بالینی قبلاً به دلیل کمبود ابزارهای مؤثر نمی‌توانستند انجام دهند، فرصت‌های علمی جدیدی را ایجاد کند.»

بهینه‌سازی بخش

در حال حاضر دو روش اصلی وجود دارد که محققان برای قطعه‌بندی مجموعه‌های جدید تصاویر پزشکی از آنها استفاده می‌کنند:

تقسیم‌بندی تعاملی: کاربر تصویری را وارد سیستم هوش مصنوعی می‌کند و مناطق مورد علاقه را علامت‌گذاری می‌کند. مدل بر اساس آن تعاملات، یک بخش را پیش‌بینی می‌کند. ابزاری که قبلاً توسط تیم MIT توسعه داده شده است، ScribblePrompt، امکان انجام این کار را فراهم می‌کند، اما باید برای هر تصویر جدید تکرار شود.

تقسیم‌بندی خودکار مبتنی بر وظیفه : یک مدل هوش مصنوعی تخصصی برای خودکارسازی تقسیم‌بندی بسازید. این روش نیاز به تقسیم‌بندی دستی صدها تصویر برای ایجاد یک مجموعه داده آموزشی و سپس آموزش مدل یادگیری ماشین دارد. هر بار که یک وظیفه جدید پیش می‌آید، کاربر باید کل این فرآیند پیچیده را دوباره شروع کند و اگر مدل اشتباه باشد، هیچ راهی برای ویرایش مستقیم آن وجود ندارد.

سیستم جدید، MultiverSeg، بهترین‌های هر دو جهان را با هم ترکیب می‌کند. این سیستم بر اساس تعاملات (مانند نقاشی) یک بخش برای یک تصویر جدید پیش‌بینی می‌کند، اما همچنین هر تصویر بخش‌بندی شده را در یک مجموعه زمینه برای مراجعه بعدی ذخیره می‌کند.

همزمان با آپلود عکس‌های جدید توسط کاربران و علامت‌گذاری آنها، مدل برای پیش‌بینی‌های دقیق‌تر با کار کمتر، به مجموعه زمینه متکی است. طراحی معماری، امکان استفاده از مجموعه‌های زمینه با هر اندازه‌ای را فراهم می‌کند و این ابزار را برای بسیاری از کاربردها انعطاف‌پذیر می‌سازد.

وانگ توضیح می‌دهد: «در برهه‌ای از زمان، برای بسیاری از وظایف، نیازی به ارائه هیچ تعامل اضافی نخواهید داشت. اگر نمونه‌های کافی در مجموعه زمینه وجود داشته باشد، مدل می‌تواند به طور دقیق بخش مورد نظر را به تنهایی پیش‌بینی کند.»

این مدل بر روی مجموعه داده‌های متنوعی آموزش داده می‌شود تا اطمینان حاصل شود که پیش‌بینی‌ها بر اساس بازخورد کاربر به تدریج بهبود می‌یابند. کاربران نیازی به آموزش مجدد مدل برای داده‌های جدید ندارند - به سادگی تصاویر پزشکی جدید را بارگذاری کرده و شروع به برچسب‌گذاری می‌کنند.

در مقایسه با سایر ابزارهای پیشرفته، MultiverSeg از نظر کارایی و دقت عملکرد بهتری دارد.

کار کمتر، نتیجه بهتر

برخلاف ابزارهای موجود، MultiverSeg به ورودی کمتری برای هر تصویر نیاز دارد. تا تصویر نهم، تنها به ۲ کلیک نیاز دارد تا تقسیم‌بندی دقیق‌تری نسبت به یک مدل وظیفه‌محور ایجاد کند.

در برخی از انواع تصاویر مانند اشعه ایکس، کاربر ممکن است فقط نیاز داشته باشد ۱-۲ تصویر را به صورت دستی بخش‌بندی کند تا مدل به اندازه کافی دقیق شود تا بقیه را پیش‌بینی کند.

تعامل به کاربران اجازه می‌دهد پیش‌بینی‌ها را اصلاح کنند و تا رسیدن به دقت مطلوب، این کار را تکرار کنند. در مقایسه با سیستم قبلی، MultiverSeg تنها با دو سوم حرکات و سه چهارم کلیک‌ها به دقت ۹۰٪ دست یافت.

وانگ افزود: «با MultiverSeg، کاربران همیشه می‌توانند تعاملاتی را برای اصلاح پیش‌بینی‌های هوش مصنوعی اضافه کنند. این امر همچنان روند کار را به میزان قابل توجهی سرعت می‌بخشد، زیرا ویرایش بسیار سریع‌تر از شروع از ابتدا است.»

در آینده، این تیم می‌خواهد این ابزار را در عمل بالینی آزمایش کند، بر اساس بازخورد بهبود بخشد و قابلیت‌های تقسیم‌بندی آن را به تصویربرداری زیست‌پزشکی سه‌بعدی گسترش دهد.

این تحقیق تا حدودی توسط شرکت Quanta Computer, Inc.، موسسه ملی بهداشت ایالات متحده (NIH) و سخت‌افزار مرکز علوم زیستی ماساچوست پشتیبانی شده است.

(منبع: اخبار MIT)

منبع: https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html