পাঠ 90.png এর ছবি
এআই অ্যাপ্লিকেশনটি মেডিকেল ইমেজ ডায়াগনসিস সমর্থন করে। ছবি: মিডজার্নি

চিকিৎসা চিত্রের প্রতি আগ্রহের ক্ষেত্রগুলি টীকাবদ্ধ করা, যা সেগমেন্টেশন নামে পরিচিত, প্রায়শই ক্লিনিকাল গবেষকরা বায়োমেডিকেল ইমেজিং সম্পর্কিত একটি নতুন গবেষণা পরিচালনা করার সময় প্রথম পদক্ষেপ নেন।

উদাহরণস্বরূপ, বয়স বাড়ার সাথে সাথে রোগীর হিপোক্যাম্পাসের আকার কীভাবে পরিবর্তিত হয় তা নির্ধারণ করার জন্য, বিজ্ঞানীদের মস্তিষ্কের স্ক্যানের একটি সিরিজের মাধ্যমে প্রতিটি হিপোক্যাম্পাসের মানচিত্র তৈরি করতে হবে। বিভিন্ন কাঠামো এবং ইমেজিংয়ের ধরণ বিবেচনা করে, এটি প্রায়শই একটি সময়সাপেক্ষ ম্যানুয়াল প্রক্রিয়া, বিশেষ করে যখন আগ্রহের অঞ্চলগুলি খারাপভাবে চিহ্নিত করা হয়।

এই প্রক্রিয়াটি সহজ করার জন্য, MIT গবেষকরা একটি AI-ভিত্তিক সিস্টেম তৈরি করেছেন যা বিজ্ঞানীদের ছবিগুলিতে ক্লিক করে, ডুডলিং করে বা বাক্স অঙ্কন করে দ্রুত নতুন বায়োমেডিকেল ইমেজিং ডেটাসেটগুলিকে ভাগ করতে দেয়। AI মডেলটি সেগমেন্টেশনের পূর্বাভাস দেওয়ার জন্য সেই মিথস্ক্রিয়াগুলি ব্যবহার করে।

ব্যবহারকারী যত বেশি ছবি ট্যাগ করেন, প্রয়োজনীয় ইন্টারঅ্যাকশনের সংখ্যা হ্রাস পায়, অবশেষে শূন্যে নেমে আসে। এরপর মডেলটি ব্যবহারকারীর কোনও অতিরিক্ত ইনপুট ছাড়াই নতুন ছবিগুলিকে সঠিকভাবে ভাগ করতে পারে।

এটি সম্ভব কারণ মডেল আর্কিটেকচারটি বিশেষভাবে পূর্ববর্তী বিভাগযুক্ত চিত্রগুলি থেকে তথ্য ব্যবহার করে পরবর্তী চিত্রগুলির জন্য ভবিষ্যদ্বাণী করার জন্য ডিজাইন করা হয়েছে। অন্যান্য মেডিকেল চিত্র বিভাজন মডেলের বিপরীতে, এই সিস্টেমটি ব্যবহারকারীদের প্রতিটি চিত্রের জন্য কাজ পুনরাবৃত্তি না করেই সম্পূর্ণ ডেটাসেট বিভাজন করতে দেয়।

উপরন্তু, এই ইন্টারেক্টিভ টুলটির প্রশিক্ষণের জন্য পূর্ব-বিভাগিত ডেটাসেটের প্রয়োজন হয় না, তাই ব্যবহারকারীদের মেশিন লার্নিং দক্ষতা বা জটিল গণনামূলক সংস্থানগুলির প্রয়োজন হয় না। তারা মডেলটিকে পুনরায় প্রশিক্ষণ না দিয়েই একটি নতুন বিভাজন কাজের জন্য সিস্টেমটি ব্যবহার করতে পারে।

দীর্ঘমেয়াদে, এই সরঞ্জামটি নতুন চিকিৎসার গবেষণাকে ত্বরান্বিত করতে পারে এবং ক্লিনিকাল ট্রায়াল এবং চিকিৎসা গবেষণার খরচ কমাতে পারে। এটি ডাক্তাররা রেডিয়েশন চিকিৎসা পরিকল্পনার মতো ক্লিনিকাল অ্যাপ্লিকেশনের দক্ষতা উন্নত করতেও ব্যবহার করতে পারেন।

"অনেক বিজ্ঞানী তাদের গবেষণার জন্য প্রতিদিন মাত্র কয়েকটি ছবি ভাগ করতে সক্ষম হতে পারেন কারণ ম্যানুয়াল সেগমেন্টেশন খুব বেশি সময়সাপেক্ষ। আমরা আশা করি এই সিস্টেমটি ক্লিনিকাল গবেষকদের এমন গবেষণা পরিচালনা করার অনুমতি দিয়ে নতুন বৈজ্ঞানিক সুযোগ খুলে দেবে যা কার্যকর সরঞ্জামের অভাবে তারা আগে করতে পারতেন না," বলেছেন বৈদ্যুতিক প্রকৌশল এবং কম্পিউটার বিজ্ঞানের পিএইচডি ছাত্রী হ্যালি ওং, মডেলটি প্রবর্তনকারী একটি গবেষণাপত্রের প্রধান লেখক।

সেগমেন্ট অপ্টিমাইজেশন

বর্তমানে গবেষকরা নতুন চিকিৎসা চিত্রের সেটগুলিকে ভাগ করার জন্য দুটি প্রধান পদ্ধতি ব্যবহার করেন:

ইন্টারেক্টিভ সেগমেন্টেশন: একজন ব্যবহারকারী AI সিস্টেমে একটি ছবি ইনপুট করেন এবং আগ্রহের অঞ্চলগুলি চিহ্নিত করেন। মডেলটি সেই মিথস্ক্রিয়াগুলির উপর ভিত্তি করে একটি সেগমেন্টের পূর্বাভাস দেয়। MIT টিম দ্বারা পূর্বে তৈরি একটি টুল, ScribblePrompt, এটি করার অনুমতি দেয়, তবে প্রতিটি নতুন ছবির জন্য এটি পুনরাবৃত্তি করতে হবে।

টাস্ক-ভিত্তিক স্বয়ংক্রিয় বিভাজন : স্বয়ংক্রিয় বিভাজন তৈরির জন্য একটি বিশেষায়িত এআই মডেল তৈরি করুন। এই পদ্ধতিতে প্রশিক্ষণ ডেটাসেট তৈরি করতে শত শত ছবি ম্যানুয়ালি বিভাজন করতে হয়, তারপর মেশিন লার্নিং মডেলকে প্রশিক্ষণ দিতে হয়। প্রতিবার যখনই কোনও নতুন কাজ শুরু হয়, ব্যবহারকারীকে এই জটিল প্রক্রিয়াটি আবার শুরু করতে হয় এবং যদি মডেলটি ভুল হয়, তাহলে সরাসরি এটি সম্পাদনা করার কোনও উপায় নেই।

নতুন সিস্টেম, মাল্টিভারসেগ, উভয় জগতের সেরাটিকে একত্রিত করে। এটি মিথস্ক্রিয়ার (যেমন ডুডলিং) উপর ভিত্তি করে একটি নতুন ছবির জন্য একটি অংশের পূর্বাভাস দেয় তবে প্রতিটি অংশযুক্ত চিত্রকে পরবর্তী রেফারেন্সের জন্য একটি প্রসঙ্গ সেটে সংরক্ষণ করে।

ব্যবহারকারীরা যখন নতুন ছবি আপলোড করে এবং সেগুলো চিহ্নিত করে, তখন মডেলটি কম পরিশ্রমে আরও সঠিক ভবিষ্যদ্বাণী করার জন্য প্রসঙ্গ সেটের উপর নির্ভর করে। স্থাপত্য নকশা যেকোনো আকারের প্রসঙ্গ সেটের অনুমতি দেয়, যা অনেক অ্যাপ্লিকেশনের জন্য টুলটিকে নমনীয় করে তোলে।

"কিছু সময়ে, অনেক কাজের জন্য, আপনাকে কোনও অতিরিক্ত মিথস্ক্রিয়া প্রদানের প্রয়োজন হবে না। যদি প্রসঙ্গ সেটে পর্যাপ্ত উদাহরণ থাকে, তাহলে মডেলটি নিজেই সেগমেন্টটি সঠিকভাবে ভবিষ্যদ্বাণী করতে পারে," ওং ব্যাখ্যা করেন।

ব্যবহারকারীর প্রতিক্রিয়ার উপর ভিত্তি করে ভবিষ্যদ্বাণীগুলি ক্রমবর্ধমানভাবে উন্নত করার জন্য মডেলটিকে বিভিন্ন ডেটাসেটের উপর প্রশিক্ষণ দেওয়া হয়। ব্যবহারকারীদের নতুন ডেটার জন্য মডেলটিকে পুনরায় প্রশিক্ষণ দেওয়ার প্রয়োজন নেই - কেবল নতুন মেডিকেল ছবি লোড করুন এবং লেবেলিং শুরু করুন।

অন্যান্য অত্যাধুনিক সরঞ্জামের সাথে তুলনা করলে, মাল্টিভারসেগ দক্ষতা এবং নির্ভুলতার দিক থেকে সেরা।

কম পরিশ্রম, ভালো ফলাফল

বিদ্যমান টুলের বিপরীতে, মাল্টিভারসেগের জন্য প্রতি ছবিতে কম ইনপুট প্রয়োজন। নবম ছবিতে, একটি টাস্ক-নির্দিষ্ট মডেলের তুলনায় আরও সঠিক সেগমেন্টেশন তৈরি করতে মাত্র 2টি ক্লিকের প্রয়োজন।

এক্স-রে-এর মতো কিছু ধরণের ছবির ক্ষেত্রে, মডেলটি বাকিটা ভবিষ্যদ্বাণী করার জন্য যথেষ্ট নির্ভুল হওয়ার আগে ব্যবহারকারীকে কেবল 1-2টি ছবি ম্যানুয়ালি ভাগ করতে হতে পারে।

ইন্টারঅ্যাক্টিভিটি ব্যবহারকারীদের ভবিষ্যদ্বাণী পরিবর্তন করতে দেয়, যতক্ষণ না তারা কাঙ্ক্ষিত নির্ভুলতা অর্জন করে। পূর্ববর্তী সিস্টেমের তুলনায়, মাল্টিভারসেগ মাত্র ২/৩ স্ট্রোক এবং ৩/৪ ক্লিকের মাধ্যমে ৯০% নির্ভুলতা অর্জন করেছে।

"মাল্টিভারসেগের সাহায্যে, ব্যবহারকারীরা সর্বদা AI ভবিষ্যদ্বাণীগুলিকে পরিমার্জিত করার জন্য ইন্টারঅ্যাকশন যোগ করতে পারেন। এটি এখনও প্রক্রিয়াটিকে উল্লেখযোগ্যভাবে গতি দেয় কারণ সম্পাদনা শুরু থেকে শুরু করার চেয়ে অনেক দ্রুত," ওং যোগ করেন।

ভবিষ্যতে, দলটি ক্লিনিকাল অনুশীলনে এই টুলটি পরীক্ষা করতে, প্রতিক্রিয়ার ভিত্তিতে উন্নতি করতে এবং এর সেগমেন্টেশন ক্ষমতা 3D বায়োমেডিকেল ইমেজিংয়ে প্রসারিত করতে চায়।

গবেষণাটি আংশিকভাবে কোয়ান্টা কম্পিউটার, ইনকর্পোরেটেড, মার্কিন জাতীয় স্বাস্থ্য ইনস্টিটিউট (এনআইএইচ) এবং ম্যাসাচুসেটস লাইফ সায়েন্সেস সেন্টারের হার্ডওয়্যার দ্বারা সমর্থিত ছিল।

(সূত্র: এমআইটি নিউজ)

সূত্র: https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html