
การใส่คำอธิบายถึงภูมิภาคที่น่าสนใจในภาพทางการแพทย์ ซึ่งเป็นกระบวนการที่เรียกว่า การแบ่งส่วน มักเป็นขั้นตอนแรกที่นักวิจัยทางคลินิกดำเนินการเมื่อทำการศึกษาวิจัยใหม่ที่เกี่ยวข้องกับการถ่ายภาพทางชีวการแพทย์
ยกตัวอย่างเช่น เพื่อประเมินว่าขนาดของฮิปโปแคมปัสของผู้ป่วยเปลี่ยนแปลงไปอย่างไรเมื่ออายุมากขึ้น นักวิทยาศาสตร์ ต้องทำแผนที่ฮิปโปแคมปัสแต่ละอันในการสแกนสมองหลายชุด เนื่องจากภาพสแกนมีโครงสร้างและประเภทที่หลากหลาย กระบวนการนี้จึงมักใช้เวลานาน โดยเฉพาะอย่างยิ่งเมื่อบริเวณที่สนใจมีขอบเขตไม่ชัดเจน
เพื่อลดความซับซ้อนของกระบวนการนี้ นักวิจัยจาก MIT ได้พัฒนาระบบที่ใช้ AI ซึ่งช่วยให้นักวิทยาศาสตร์สามารถแบ่งกลุ่มข้อมูลภาพทางชีวการแพทย์ใหม่ๆ ได้อย่างรวดเร็ว โดยการคลิก วาดเส้น หรือวาดกรอบบนภาพ โมเดล AI จะใช้ปฏิสัมพันธ์เหล่านี้เพื่อคาดการณ์การแบ่งกลุ่ม
เมื่อผู้ใช้แท็กรูปภาพมากขึ้น จำนวนการโต้ตอบที่จำเป็นก็จะลดลง จนในที่สุดก็ลดลงเหลือศูนย์ จากนั้นโมเดลจะสามารถแบ่งกลุ่มรูปภาพใหม่ได้อย่างแม่นยำโดยไม่ต้องมีอินพุตเพิ่มเติมจากผู้ใช้
สิ่งนี้เป็นไปได้เพราะสถาปัตยกรรมแบบจำลองได้รับการออกแบบมาโดยเฉพาะเพื่อใช้ประโยชน์จากข้อมูลจากภาพที่แบ่งส่วนก่อนหน้านี้ เพื่อคาดการณ์ภาพถัดไป ซึ่งแตกต่างจากแบบจำลองการแบ่งส่วนภาพทางการแพทย์อื่นๆ ระบบนี้ช่วยให้ผู้ใช้สามารถแบ่งส่วนชุดข้อมูลทั้งหมดได้โดยไม่ต้องทำซ้ำการทำงานสำหรับแต่ละภาพ
นอกจากนี้ เครื่องมือแบบอินเทอร์แอคทีฟนี้ไม่จำเป็นต้องใช้ชุดข้อมูลที่แบ่งส่วนไว้ล่วงหน้าในการฝึก ดังนั้นผู้ใช้จึงไม่จำเป็นต้องมีความเชี่ยวชาญด้านการเรียนรู้ของเครื่องหรือทรัพยากรการคำนวณที่ซับซ้อน พวกเขาสามารถใช้ระบบสำหรับงานการแบ่งส่วนใหม่ได้โดยไม่ต้องฝึกแบบจำลองใหม่
ในระยะยาว เครื่องมือนี้จะช่วยเร่งการวิจัยวิธีการรักษาใหม่ๆ และลดต้นทุนการทดลองทางคลินิกและการวิจัยทางการแพทย์ นอกจากนี้ยังสามารถนำมาใช้โดยแพทย์เพื่อปรับปรุงประสิทธิภาพของการประยุกต์ใช้ทางคลินิก เช่น การวางแผนการรักษาด้วยรังสี
“นักวิทยาศาสตร์หลายคนอาจสามารถแบ่งส่วนภาพได้เพียงไม่กี่ภาพต่อวันสำหรับการวิจัยของพวกเขา เนื่องจากการแบ่งส่วนด้วยมือนั้นใช้เวลานานเกินไป เราหวังว่าระบบนี้จะเปิดโอกาสทางวิทยาศาสตร์ใหม่ๆ ด้วยการช่วยให้นักวิจัยทางคลินิกสามารถทำการศึกษาที่พวกเขาไม่สามารถทำได้มาก่อนเนื่องจากขาดเครื่องมือที่มีประสิทธิภาพ” ฮัลลี หว่อง นักศึกษาปริญญาเอกสาขาวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ หัวหน้าทีมวิจัยที่นำเสนอแบบจำลองนี้ กล่าว
การเพิ่มประสิทธิภาพส่วนต่างๆ
ปัจจุบันมีวิธีการหลักสองวิธีที่นักวิจัยใช้ในการแบ่งกลุ่มภาพทางการแพทย์ชุดใหม่:
การแบ่งส่วนแบบโต้ตอบ: ผู้ใช้ป้อนภาพลงในระบบ AI และทำเครื่องหมายบริเวณที่สนใจ โมเดลจะทำนายส่วนต่างๆ โดยอิงจากการโต้ตอบเหล่านั้น เครื่องมือ ScribblePrompt ที่ทีม MIT พัฒนาขึ้นก่อนหน้านี้ ช่วยให้สามารถทำเช่นนี้ได้ แต่ต้องทำซ้ำสำหรับแต่ละภาพใหม่
การแบ่งส่วนข้อมูลอัตโนมัติตามงาน : สร้างแบบจำลอง AI เฉพาะทางเพื่อแบ่งส่วนข้อมูลโดยอัตโนมัติ วิธีนี้จำเป็นต้องแบ่งส่วนข้อมูลหลายร้อยภาพด้วยตนเองเพื่อสร้างชุดข้อมูลสำหรับฝึกอบรม จากนั้นจึงฝึกอบรมแบบจำลองการเรียนรู้ของเครื่อง ทุกครั้งที่มีงานใหม่เกิดขึ้น ผู้ใช้จะต้องเริ่มกระบวนการที่ซับซ้อนนี้ใหม่ทั้งหมด และหากแบบจำลองไม่ถูกต้อง ก็จะไม่มีทางแก้ไขได้โดยตรง
ระบบใหม่ MultiverSeg ผสานรวมข้อดีของทั้งสองระบบเข้าด้วยกัน ระบบจะทำนายเซกเมนต์ของภาพใหม่โดยอิงจากการโต้ตอบ (เช่น การวาดรูปเล่น) และยังบันทึกภาพแต่ละเซกเมนต์ลงในชุดบริบทเพื่อใช้อ้างอิงในภายหลังอีกด้วย
เมื่อผู้ใช้อัปโหลดรูปภาพใหม่และทำเครื่องหมายไว้ โมเดลจะอาศัยชุดบริบทเพื่อทำนายผลที่แม่นยำยิ่งขึ้นโดยใช้ความพยายามน้อยลง การออกแบบสถาปัตยกรรมรองรับชุดบริบทได้ทุกขนาด ทำให้เครื่องมือนี้มีความยืดหยุ่นสำหรับการใช้งานที่หลากหลาย
“ในบางจุด สำหรับงานหลายๆ งาน คุณไม่จำเป็นต้องมีปฏิสัมพันธ์เพิ่มเติมใดๆ เลย หากมีตัวอย่างเพียงพอในชุดบริบท โมเดลจะสามารถทำนายส่วนต่างๆ ได้อย่างแม่นยำด้วยตัวเอง” หว่องอธิบาย
โมเดลนี้ได้รับการฝึกฝนจากชุดข้อมูลที่หลากหลาย เพื่อให้มั่นใจว่าการทำนายจะดีขึ้นเรื่อยๆ ตามความคิดเห็นของผู้ใช้ ผู้ใช้ไม่จำเป็นต้องฝึกฝนโมเดลใหม่เพื่อรับข้อมูลใหม่ เพียงแค่โหลดภาพทางการแพทย์ใหม่และเริ่มการติดฉลาก
เมื่อเปรียบเทียบกับเครื่องมือล้ำสมัยอื่นๆ MultiverSeg มีประสิทธิภาพและความแม่นยำเหนือกว่า
ทำงานน้อยลง ผลลัพธ์ดีขึ้น
ต่างจากเครื่องมือที่มีอยู่ในปัจจุบัน MultiverSeg ใช้อินพุตต่อภาพน้อยกว่า เมื่อถึงภาพที่ 9 จะใช้เพียง 2 คลิกเพื่อสร้างการแบ่งส่วนที่แม่นยำกว่าแบบจำลองเฉพาะงาน
สำหรับภาพบางประเภท เช่น ภาพเอกซเรย์ ผู้ใช้จำเป็นต้องแบ่งส่วนภาพด้วยตนเองเพียง 1-2 ภาพเท่านั้น ก่อนที่แบบจำลองจะมีความแม่นยำเพียงพอที่จะคาดการณ์ภาพที่เหลือได้
การโต้ตอบช่วยให้ผู้ใช้สามารถปรับเปลี่ยนการทำนายได้ ทำซ้ำจนกว่าจะถึงความแม่นยำที่ต้องการ เมื่อเทียบกับระบบเดิม MultiverSeg มีความแม่นยำถึง 90% โดยใช้จังหวะเพียง 2 ใน 3 และคลิกเพียง 3 ใน 4
“ด้วย MultiverSeg ผู้ใช้สามารถเพิ่มการโต้ตอบเพื่อปรับแต่งการคาดการณ์ AI ได้ตลอดเวลา ซึ่งยังช่วยเพิ่มความเร็วของกระบวนการได้อย่างมาก เพราะการแก้ไขข้อมูลนั้นเร็วกว่าการเริ่มต้นใหม่มาก” Wong กล่าวเสริม
ในอนาคต ทีมงานต้องการทดสอบเครื่องมือในการปฏิบัติทางคลินิก ปรับปรุงตามข้อเสนอแนะ และขยายความสามารถในการแบ่งส่วนข้อมูลไปสู่การถ่ายภาพทางการแพทย์สามมิติ
งานวิจัยนี้ได้รับการสนับสนุนบางส่วนโดย Quanta Computer, Inc. สถาบันสุขภาพแห่งชาติของสหรัฐอเมริกา (NIH) และฮาร์ดแวร์จากศูนย์วิทยาศาสตร์ชีวภาพแมสซาชูเซตส์
(ที่มา: MIT News)
ที่มา: https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html
การแสดงความคิดเห็น (0)