کاربرد شبکه‌های عصبی کانولوشنی در رادیولوژی


شبکه عصبی کانولوشنی (CNN) یک کلاس از شبکه‌های عصبی مصنوعی است که در تسک‌های مختلف بینایی ماشین مورد استفاده قرار می‌گیرد و همچنین توجهات را در سایر حوزه‌ها از جمله رادیولوژی به خود جلب کرده است. CNN با این هدف طراحی شده است که به طور خودکار و انطباقی سلسله مراتبی از ویژگی‌ها را از طریق پس انتشار خطا (backpropagation) یاد بگیرد و برای این منظور از چندین بلوک ساختاری چون لایه‌های کانولوشن، لایه‌های pooling و لایه‌های Fully connected استفاده می‌کند. در این مقاله کاربرد CNN در انواع مختلف تسک‌های رادیولوژی بررسی می‌شود و همچنین چالش‌ها و گرایشات آینده در حوزه‎‌ی رادیولوژی مورد بحث قرار خواهد گرفت.

در این مقاله به بررسی کاربردهای اخیر در زمینه‌ی رادیولوژی می‌پردازیم که به رده‌های زیر تقسیم بندی می‌شوند: کلاسبندی (Classification)، سگمنت بندی (segmentation)، تشخیص (detection) و سایر موارد.

کلاسبندی تصاویر پزشکی با CNN

در حوزه‌ی تحلیل تصاویر پزشکی، کلاسبندی یا طبقه بندی با یادگیری عمیق معمولاً از ضایعات هدف مشخص شده در تصاویر پزشکی استفاده می‌کند و این ضایعات را به دو یا چند کلاس کلاسبندی می‌کند. برای مثال، یادگیری عمیق اغلب برای کلاسبندی ندول‌های ریه (lung nodules) روی تصاویر CT (Computed tomography)  استفاده می‌شود و آنها را به دو دسته‌ی خوش خیم یا بدخیم جدا می‌کند (شکل زیر را ببینید). همانطور که نشان داده شده است، در ابتدا لازم است که تعداد زیادی داده‌ی آموزشی با برچسب مربوطه برای کلاسبندی موثر با CNN در دسترس باشد. برای کلاسبندی ندول‌های ریه، تصاویر CT از ریه و برچسب‌های آن (برای مثال، خوش خیم یا سرطانی) به عنوان داده‌های آموزشی استفاده می‌شوند. در شکل 1 قسمت b,c دو نمونه از داده‌های آموزشی کلاسبندی ندول ریه بین ندول خوش خیم ریه و سرطان ریه را نشان می‌دهد. تصویر 1b داده‌های آموزشی را نشان می‌دهد که در آن هر داده (datum) شامل تصویر و برچسب آن است و تصویر 1c داده‌های آموزشی را نشان می‌دهد که در آن هر داده نشانگر سه تصویر (تصاویر محوری، کرونر و ساژیتال از یک ندول ریه) و برچسب‌های آن است. پس از آموزش CNN، ضایعات هدف تصاویر پزشکی را می‎توان توسط سیستم‌های تشخیص به کمک کامپیوتر (CADe) یا پزشکان مورد استفاده قرار داد.

طبقه بندی تومور با CNN

شکل1: نمای شماتیک از سیستم کلاسبندی با CNN و نمونه‌هایی از داده‌ی آموزش. A)سیستم کلاسبندی با CNN در فاز استقرار. C: داده آموزشی مورد استفاده در فاز آموزش (منبع)

 

از آنجاییکه تصاویر دو بعدی اغلب در بینایی کامپیوتر مورد استفاده قرار می‌گیرند؛ شبکه‌های یادگیری عمیق توسعه یافته برای تصاویر دو بعدی (2D-CNN) مستقیماً روی تصاویر سه بعدی بدست آمده از رادیولوژی استفاده نمی‌شوند. برای اعمال یادگیری عمیق به تصاویر سه بعدی رادیولوژی، رویکردهای مختلفی چون معماری‌های سفارشی استفاده شده است. برخی از محققان از multistream CNN برای کلاسبندی کاندیدهای ندول تصاویر CT سینه استفاده کردند و از دیتاست‌های معروفی چون Lung Image Database Consortium و Image Database Resource Initiative (LIDC-IDRI) و ANODE09 و the Danish Lung Cancer Screening Trial استفاده کردند. آنها تکه‌ (patch)های تصاویر دوبعدی از ندول کاندید استفاده کردند و این پچ‌ها را در streamهای مختلف استفاده کرده و در نهایت در لایه‌های fully connected ادغام کردند تا کلاسبندی نهایی بدست آید. همچنین یکی از مطالعات اخیر از 3D-CNN برای ضبط کامل اطلاعات زمینه سه بعدی ندول‌های ریه استفاده کرده است. مدل سه بعدی CNN آنها کلاسبندی باینری انجام داده است (ندول‌های خوش خیم یا بدخیم) و برای این منظور از دیتابیس LIDC-IDRI استفاده کردند.

ناحیه بندی تصویر با CNN

ناحیه بندی اندام‌ها یا ساختارهای تشریحی یک تکنیک پردازش تصاویر برای تحلیل تصاویر پزشکی است مانن ارزیابی کمی پارامترهای بالینی (حجم و شکل اندام) و سیستم تشخیص با کمک کامپیوتر (CAD). در بخش قبل، کلاسبندی به سگمنت بندی ضایعات می‌پرداخت. سگمنت بندی می‌تواند به صورت دستی توسط رادیولوژیست‌ها یا پرسنل متخصص انجام شود که فرآیند زمانبری است. با این حال می‌توان از شبکه CNN نیز برای این منظور استفاده کرد. شکل 2a یک نمونه از سگمنت بندی رحم با تومور بدخیم را در MRI نشان می‌دهد. در چنین مواردی، سیستم سگمنت بندی به طور مستقیم یک تصویر کامل را دریافت می‌کند و خروجی سگمنت بندی را تحویل می‌دهد. داده‌ی آموزشی برای سیستم سگمنت بندی شامل تصاویر پزشکی متشکل از اندام یا ساختار مورد نظر و نتیجه سگمنت بندی است؛ دومی عمدتاً از سگمنت‌بندی دستی بدست می‌آید. شکل 2b یک نمونه از داده‌ی آموزشی برای سیستم سگمنت بندی رحم با تومور بدخیم را نشان می‌دهد. برخلاف کلاسبندی، از آن جایی که کل تصویر وارد سیستم سگمنت بندی می‌شود، لازم است که سیستم spatial context کل تصویر را ثبت کند.

ناحیه بندی تصویر با CNN

شکل2: شماتیک یک سیستم برای سگمنت بندی رحم با تومور بدخیم و نمونه‌هایی از داده‌ی آموزشی آن. a) سیستم سگمنت بندی با CNN در فاز استقرار و b)داده‌ی آموزش مورد استفاده در فاز آموزش. (منبع)

 

یک روش برای انجام سگمنت بندی استفاده از کلاسبند CNN برای محاسبه احتمال یک اندام یا ساختار تشریحی است. در این رویکرد؛ فرآیند سگمنت بندی به دو مرحله تقسیم می‌شود؛ گام اول ساخت نقشه احتمال اندام یا ساختار تشریحی با استفاده از CNN و تکه‌های تصویر است و مرحله دوم اصلاح است که در آن از زمینه کلی تصاویر و نقشه احتمال استفاده می‌شود.

 

تشخیص بیماری با CNN

یکی از کارهای رایج برای رادیولوژیست‌ها، تشخیص ناهنجاری (آنومالی) در تصاویر پزشکی است. آنومالی‌ها ممکن است نادر باشند و باید در میان موارد عادی شناسایی شوند. یکی از مطالعات قبلی، سودمندی 2D-CNN را برای تشخیص سل در رادیوگرافی قفسه سینه بررسی کرده است. مطالعه‌ی آنها از دو نوع مختلف 2D-CNN، AlexNet و GoogleNet برای تشخیص سل ریوی رادیوگرافی قفسه سینه استفاده کرده است. برای توسعه سیستم تشخیص و ارزیابی عملکرد آن، دیتاست 1007 رادیوگرافی قفسه سینه استفاده شده است. طبق نتایج بدست آمده، بهترین ROC برای تشخیص سل ریوی افراد سالم 0.99 بود که با مجموعه CNNهای دو بعدی AlexNet و GoogleNet بدست آمده بود.

 

سایر کاربردهای CNN در رادیولوژی

Low-dose CT به طور گسترده در وضعیت‌های بالینی استفاده می‌شود. برای مثال، low-dose CT برای غربالگری سرطان ریه مفید است. از آنجاییکه تصاویر نویزی low-dose CT مانع از ارزیابی قابل اعتماد تصاویر CT می‌شوند، روش‌های متعددی از پردازش تصاویر برای حذف نویز low-dose CT استفاده می‌شوند. دو مطالعه اخیر نشان داده اند که تصاویر ultra-low-dose CT و low-dose CT را می‌توان به طور موثری با یادگیری عمیق نویززدایی کرد. سیستم آنها تصاویر CT نویزی را به تکه‌ (patch)های تصاویر تقسیم بندی می‌کند و این تکه تصاویر را نویززدایی کرده و سپس تصویر CT جدید را از تکه تصاویر نویززدایی شده بازسازی می‌کند.

کاهش نویز تصویر با CNN

شکل3: شماتیک سیستم نویززدایی تصاویر ultra-low-dose CT فانتوم و نمونه‌هایی از داده‌ی آموزشی آن. A)سیستم نویززدایی با CNN در فاز استقرار و b)داده‌ی آموزشی مورد استفاده در فاز آموزش

 

چالش‌ها و گرایشات آینده یادگیری عمیق در حوزه پزشکی

اگرچه پیشرفت‌های اخیر یادگیری عمیق شگفت انگیز بوده است، اما هنوز در کاربردهای آن برای تصویربرداری پزشکی، چالش‌هایی وجود دارد. یادگیری عمیق به عنوان یک جعبه سیاه در نظر گرفته می‌شود زیرا ردپایی از بررسی برای تصمیمات خود ندارد. محققان تکنیک‌های مختلفی را در پاسخ به این مسئله پیشنهاد کرده‌اند که بینشی ارائه می‌دهد که چه ویژگی‌هایی در feature mapها وجود دارند و کدام بخش از تصویر مسئول آن پیش بینی است که attribution نام دارد. بسیاری از مطالعات نشان می‌دهند روشی که شبکه‌های عصبی، ورودی خود را می‌بینند و آن را پیش بینی می‌کنند متفاوت از ما است. پژوهش در مورد آسیب پذیری شبکه‌های عصبی عمیق در تصویربرداری پزشکی بسیار مهم هستند زیرا کاربرد بالینی یادگیری عمیق مستلزم robustness شبکه است زیرا نتیجه آن، وضعیت یک بیمار را تعیین می‌کند و کار ساده‌ای چون طبقه بندی تصاویر غیرپزشکی مانند تفکیک تصاویر سگ و گربه نیست.

 


دیدگاه ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

code