
Adnotowanie obszarów zainteresowania na obrazach medycznych, czyli proces znany jako segmentacja, jest często pierwszym krokiem podejmowanym przez badaczy klinicznych podczas prowadzenia nowego badania z wykorzystaniem obrazowania biomedycznego.
Na przykład, aby określić, jak zmienia się rozmiar hipokampa pacjenta wraz z wiekiem, naukowcy muszą zmapować każdy hipokamp za pomocą serii skanów mózgu. Biorąc pod uwagę mnogość struktur i rodzajów obrazowania, jest to często czasochłonny proces manualny, zwłaszcza gdy obszary zainteresowania są słabo odgraniczone.
Aby uprościć ten proces, naukowcy z MIT opracowali system oparty na sztucznej inteligencji, który pozwala naukowcom szybko segmentować nowe zestawy danych obrazowania biomedycznego poprzez klikanie, rysowanie lub rysowanie pól na obrazach. Model sztucznej inteligencji wykorzystuje te interakcje do przewidywania segmentacji.
W miarę jak użytkownik taguje kolejne obrazy, liczba wymaganych interakcji maleje, aż w końcu spada do zera. Model może wtedy precyzyjnie segmentować nowe obrazy bez konieczności dodatkowego wprowadzania danych przez użytkownika.
Jest to możliwe, ponieważ architektura modelu została specjalnie zaprojektowana tak, aby wykorzystywać informacje z wcześniej segmentowanych obrazów do tworzenia prognoz dla kolejnych obrazów. W przeciwieństwie do innych modeli segmentacji obrazów medycznych, system ten pozwala użytkownikom segmentować cały zbiór danych bez konieczności powtarzania tej czynności dla każdego obrazu.
Co więcej, to interaktywne narzędzie nie wymaga do trenowania wstępnie segmentowanego zbioru danych, dzięki czemu użytkownicy nie muszą posiadać specjalistycznej wiedzy z zakresu uczenia maszynowego ani skomplikowanych zasobów obliczeniowych. Mogą wykorzystać system do nowego zadania segmentacji bez konieczności ponownego trenowania modelu.
W dłuższej perspektywie narzędzie to może przyspieszyć badania nad nowymi metodami leczenia i obniżyć koszty badań klinicznych i badań medycznych. Lekarze mogliby je również wykorzystać do poprawy efektywności zastosowań klinicznych, takich jak planowanie radioterapii.
„Wielu naukowców może segmentować tylko kilka obrazów dziennie na potrzeby swoich badań, ponieważ ręczna segmentacja jest zbyt czasochłonna. Mamy nadzieję, że ten system otworzy nowe możliwości naukowe, umożliwiając badaczom klinicznym prowadzenie badań, których wcześniej nie mogli przeprowadzić z powodu braku skutecznych narzędzi” – powiedziała Hallee Wong, doktorantka z elektrotechniki i informatyki, główna autorka artykułu wprowadzającego ten model.
Optymalizacja segmentów
Obecnie badacze stosują dwie główne metody segmentacji nowych zestawów obrazów medycznych:
Segmentacja interaktywna: Użytkownik wprowadza obraz do systemu AI i zaznacza obszary zainteresowania. Model przewiduje segment na podstawie tych interakcji. Narzędzie opracowane wcześniej przez zespół MIT, ScribblePrompt, umożliwia to, ale musi być powtarzane dla każdego nowego obrazu.
Automatyczna segmentacja oparta na zadaniach : Zbuduj wyspecjalizowany model AI do automatyzacji segmentacji. Ta metoda wymaga ręcznej segmentacji setek obrazów w celu utworzenia zbioru danych treningowych, a następnie trenowania modelu uczenia maszynowego. Za każdym razem, gdy pojawia się nowe zadanie, użytkownik musi rozpocząć cały ten złożony proces od nowa, a jeśli model jest błędny, nie ma możliwości jego bezpośredniej edycji.
Nowy system MultiverSeg łączy w sobie to, co najlepsze z obu światów. Przewiduje segment dla nowego obrazu na podstawie interakcji (takich jak bazgranie), a jednocześnie zapisuje każdy segmentowany obraz w zestawie kontekstowym do późniejszego wykorzystania.
W miarę jak użytkownicy przesyłają nowe zdjęcia i je oznaczają, model wykorzystuje zestaw kontekstowy, aby tworzyć dokładniejsze prognozy przy mniejszym nakładzie pracy. Projekt architektoniczny pozwala na tworzenie zestawów kontekstowych dowolnej wielkości, dzięki czemu narzędzie jest elastyczne i sprawdza się w wielu zastosowaniach.
„W pewnym momencie, w przypadku wielu zadań, nie będzie potrzeby zapewniania żadnej dodatkowej interakcji. Jeśli w zestawie kontekstowym jest wystarczająco dużo przykładów, model może samodzielnie dokładnie przewidzieć segment” – wyjaśnia Wong.
Model jest trenowany na zróżnicowanych zestawach danych, aby zapewnić stopniową poprawę prognoz na podstawie opinii użytkowników. Użytkownicy nie muszą ponownie trenować modelu dla nowych danych – wystarczy załadować nowe obrazy medyczne i rozpocząć etykietowanie.
W testach porównawczych z innymi najnowocześniejszymi narzędziami MultiverSeg przewyższa je pod względem wydajności i dokładności.
Mniej pracy, lepsze wyniki
W przeciwieństwie do istniejących narzędzi, MultiverSeg wymaga mniej danych wejściowych na obraz. Przy dziewiątym obrazie wystarczą tylko dwa kliknięcia, aby wygenerować dokładniejszą segmentację niż model specyficzny dla danego zadania.
W przypadku niektórych typów obrazów, na przykład zdjęć rentgenowskich, użytkownik może musieć ręcznie segmentować tylko 1–2 obrazy, zanim model będzie wystarczająco dokładny, aby przewidzieć pozostałe.
Interaktywność pozwala użytkownikom modyfikować przewidywania, iterując je aż do osiągnięcia pożądanej dokładności. W porównaniu z poprzednim systemem, MultiverSeg osiągnął 90% dokładności przy zaledwie 2/3 ruchów i 3/4 kliknięć.
„Dzięki MultiverSeg użytkownicy mogą w każdej chwili dodawać interakcje, aby udoskonalić prognozy sztucznej inteligencji. To jednak znacznie przyspiesza proces, ponieważ edycja jest znacznie szybsza niż zaczynanie od zera” – dodał Wong.
W przyszłości zespół zamierza przetestować narzędzie w praktyce klinicznej, udoskonalić je w oparciu o opinie i rozszerzyć jego możliwości segmentacji na obrazowanie biomedyczne 3D.
Badania zostały częściowo sfinansowane przez Quanta Computer, Inc., amerykańskie Narodowe Instytuty Zdrowia (NIH) oraz sprzęt z Massachusetts Life Sciences Center.
(Źródło: MIT News)
Źródło: https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html
Komentarz (0)