کاربرد شبکههای عصبی کانولوشنی در رادیولوژی
- دسته:اخبار علمی
- هما کاشفی
شبکه عصبی کانولوشنی (CNN) یک کلاس از شبکههای عصبی مصنوعی است که در تسکهای مختلف بینایی ماشین مورد استفاده قرار میگیرد و همچنین توجهات را در سایر حوزهها از جمله رادیولوژی به خود جلب کرده است. CNN با این هدف طراحی شده است که به طور خودکار و انطباقی سلسله مراتبی از ویژگیها را از طریق پس انتشار خطا (backpropagation) یاد بگیرد و برای این منظور از چندین بلوک ساختاری چون لایههای کانولوشن، لایههای pooling و لایههای Fully connected استفاده میکند. در این مقاله کاربرد CNN در انواع مختلف تسکهای رادیولوژی بررسی میشود و همچنین چالشها و گرایشات آینده در حوزهی رادیولوژی مورد بحث قرار خواهد گرفت.
در این مقاله به بررسی کاربردهای اخیر در زمینهی رادیولوژی میپردازیم که به ردههای زیر تقسیم بندی میشوند: کلاسبندی (Classification)، سگمنت بندی (segmentation)، تشخیص (detection) و سایر موارد.
کلاسبندی تصاویر پزشکی با CNN
در حوزهی تحلیل تصاویر پزشکی، کلاسبندی یا طبقه بندی با یادگیری عمیق معمولاً از ضایعات هدف مشخص شده در تصاویر پزشکی استفاده میکند و این ضایعات را به دو یا چند کلاس کلاسبندی میکند. برای مثال، یادگیری عمیق اغلب برای کلاسبندی ندولهای ریه (lung nodules) روی تصاویر CT (Computed tomography) استفاده میشود و آنها را به دو دستهی خوش خیم یا بدخیم جدا میکند (شکل زیر را ببینید). همانطور که نشان داده شده است، در ابتدا لازم است که تعداد زیادی دادهی آموزشی با برچسب مربوطه برای کلاسبندی موثر با CNN در دسترس باشد. برای کلاسبندی ندولهای ریه، تصاویر CT از ریه و برچسبهای آن (برای مثال، خوش خیم یا سرطانی) به عنوان دادههای آموزشی استفاده میشوند. در شکل 1 قسمت b,c دو نمونه از دادههای آموزشی کلاسبندی ندول ریه بین ندول خوش خیم ریه و سرطان ریه را نشان میدهد. تصویر 1b دادههای آموزشی را نشان میدهد که در آن هر داده (datum) شامل تصویر و برچسب آن است و تصویر 1c دادههای آموزشی را نشان میدهد که در آن هر داده نشانگر سه تصویر (تصاویر محوری، کرونر و ساژیتال از یک ندول ریه) و برچسبهای آن است. پس از آموزش CNN، ضایعات هدف تصاویر پزشکی را میتوان توسط سیستمهای تشخیص به کمک کامپیوتر (CADe) یا پزشکان مورد استفاده قرار داد.
شکل1: نمای شماتیک از سیستم کلاسبندی با CNN و نمونههایی از دادهی آموزش. A)سیستم کلاسبندی با CNN در فاز استقرار. C: داده آموزشی مورد استفاده در فاز آموزش (منبع)
از آنجاییکه تصاویر دو بعدی اغلب در بینایی کامپیوتر مورد استفاده قرار میگیرند؛ شبکههای یادگیری عمیق توسعه یافته برای تصاویر دو بعدی (2D-CNN) مستقیماً روی تصاویر سه بعدی بدست آمده از رادیولوژی استفاده نمیشوند. برای اعمال یادگیری عمیق به تصاویر سه بعدی رادیولوژی، رویکردهای مختلفی چون معماریهای سفارشی استفاده شده است. برخی از محققان از multistream CNN برای کلاسبندی کاندیدهای ندول تصاویر CT سینه استفاده کردند و از دیتاستهای معروفی چون Lung Image Database Consortium و Image Database Resource Initiative (LIDC-IDRI) و ANODE09 و the Danish Lung Cancer Screening Trial استفاده کردند. آنها تکه (patch)های تصاویر دوبعدی از ندول کاندید استفاده کردند و این پچها را در streamهای مختلف استفاده کرده و در نهایت در لایههای fully connected ادغام کردند تا کلاسبندی نهایی بدست آید. همچنین یکی از مطالعات اخیر از 3D-CNN برای ضبط کامل اطلاعات زمینه سه بعدی ندولهای ریه استفاده کرده است. مدل سه بعدی CNN آنها کلاسبندی باینری انجام داده است (ندولهای خوش خیم یا بدخیم) و برای این منظور از دیتابیس LIDC-IDRI استفاده کردند.
ناحیه بندی تصویر با CNN
ناحیه بندی اندامها یا ساختارهای تشریحی یک تکنیک پردازش تصاویر برای تحلیل تصاویر پزشکی است مانن ارزیابی کمی پارامترهای بالینی (حجم و شکل اندام) و سیستم تشخیص با کمک کامپیوتر (CAD). در بخش قبل، کلاسبندی به سگمنت بندی ضایعات میپرداخت. سگمنت بندی میتواند به صورت دستی توسط رادیولوژیستها یا پرسنل متخصص انجام شود که فرآیند زمانبری است. با این حال میتوان از شبکه CNN نیز برای این منظور استفاده کرد. شکل 2a یک نمونه از سگمنت بندی رحم با تومور بدخیم را در MRI نشان میدهد. در چنین مواردی، سیستم سگمنت بندی به طور مستقیم یک تصویر کامل را دریافت میکند و خروجی سگمنت بندی را تحویل میدهد. دادهی آموزشی برای سیستم سگمنت بندی شامل تصاویر پزشکی متشکل از اندام یا ساختار مورد نظر و نتیجه سگمنت بندی است؛ دومی عمدتاً از سگمنتبندی دستی بدست میآید. شکل 2b یک نمونه از دادهی آموزشی برای سیستم سگمنت بندی رحم با تومور بدخیم را نشان میدهد. برخلاف کلاسبندی، از آن جایی که کل تصویر وارد سیستم سگمنت بندی میشود، لازم است که سیستم spatial context کل تصویر را ثبت کند.
شکل2: شماتیک یک سیستم برای سگمنت بندی رحم با تومور بدخیم و نمونههایی از دادهی آموزشی آن. a) سیستم سگمنت بندی با CNN در فاز استقرار و b)دادهی آموزش مورد استفاده در فاز آموزش. (منبع)
یک روش برای انجام سگمنت بندی استفاده از کلاسبند CNN برای محاسبه احتمال یک اندام یا ساختار تشریحی است. در این رویکرد؛ فرآیند سگمنت بندی به دو مرحله تقسیم میشود؛ گام اول ساخت نقشه احتمال اندام یا ساختار تشریحی با استفاده از CNN و تکههای تصویر است و مرحله دوم اصلاح است که در آن از زمینه کلی تصاویر و نقشه احتمال استفاده میشود.
تشخیص بیماری با CNN
یکی از کارهای رایج برای رادیولوژیستها، تشخیص ناهنجاری (آنومالی) در تصاویر پزشکی است. آنومالیها ممکن است نادر باشند و باید در میان موارد عادی شناسایی شوند. یکی از مطالعات قبلی، سودمندی 2D-CNN را برای تشخیص سل در رادیوگرافی قفسه سینه بررسی کرده است. مطالعهی آنها از دو نوع مختلف 2D-CNN، AlexNet و GoogleNet برای تشخیص سل ریوی رادیوگرافی قفسه سینه استفاده کرده است. برای توسعه سیستم تشخیص و ارزیابی عملکرد آن، دیتاست 1007 رادیوگرافی قفسه سینه استفاده شده است. طبق نتایج بدست آمده، بهترین ROC برای تشخیص سل ریوی افراد سالم 0.99 بود که با مجموعه CNNهای دو بعدی AlexNet و GoogleNet بدست آمده بود.
سایر کاربردهای CNN در رادیولوژی
Low-dose CT به طور گسترده در وضعیتهای بالینی استفاده میشود. برای مثال، low-dose CT برای غربالگری سرطان ریه مفید است. از آنجاییکه تصاویر نویزی low-dose CT مانع از ارزیابی قابل اعتماد تصاویر CT میشوند، روشهای متعددی از پردازش تصاویر برای حذف نویز low-dose CT استفاده میشوند. دو مطالعه اخیر نشان داده اند که تصاویر ultra-low-dose CT و low-dose CT را میتوان به طور موثری با یادگیری عمیق نویززدایی کرد. سیستم آنها تصاویر CT نویزی را به تکه (patch)های تصاویر تقسیم بندی میکند و این تکه تصاویر را نویززدایی کرده و سپس تصویر CT جدید را از تکه تصاویر نویززدایی شده بازسازی میکند.
شکل3: شماتیک سیستم نویززدایی تصاویر ultra-low-dose CT فانتوم و نمونههایی از دادهی آموزشی آن. A)سیستم نویززدایی با CNN در فاز استقرار و b)دادهی آموزشی مورد استفاده در فاز آموزش
چالشها و گرایشات آینده یادگیری عمیق در حوزه پزشکی
اگرچه پیشرفتهای اخیر یادگیری عمیق شگفت انگیز بوده است، اما هنوز در کاربردهای آن برای تصویربرداری پزشکی، چالشهایی وجود دارد. یادگیری عمیق به عنوان یک جعبه سیاه در نظر گرفته میشود زیرا ردپایی از بررسی برای تصمیمات خود ندارد. محققان تکنیکهای مختلفی را در پاسخ به این مسئله پیشنهاد کردهاند که بینشی ارائه میدهد که چه ویژگیهایی در feature mapها وجود دارند و کدام بخش از تصویر مسئول آن پیش بینی است که attribution نام دارد. بسیاری از مطالعات نشان میدهند روشی که شبکههای عصبی، ورودی خود را میبینند و آن را پیش بینی میکنند متفاوت از ما است. پژوهش در مورد آسیب پذیری شبکههای عصبی عمیق در تصویربرداری پزشکی بسیار مهم هستند زیرا کاربرد بالینی یادگیری عمیق مستلزم robustness شبکه است زیرا نتیجه آن، وضعیت یک بیمار را تعیین میکند و کار سادهای چون طبقه بندی تصاویر غیرپزشکی مانند تفکیک تصاویر سگ و گربه نیست.
دیدگاه ها