شبکههای عمیق در نقشهای مختلف در تحلیل سیگنال EEG
- دسته:اخبار علمی
- هما کاشفی
اگر تابحال مقالات مربوط به کاربرد شبکههای عمیق در پردازش انواع مختلف سیگنال EEG را بررسی کرده باشید، احتمالاً متوجه شدهاید که بسته به کاربرد و عملکرد مناسب مدل، شبکههای عمیق در نقشهای مختلفی ظاهر شدهاند. برای مثال در برخی از مقالات از شبکههای عمیق به عنوان استخراج کننده ویژگی استفاده شده است و در برخی دیگر، نقش کاهش دهنده ی ابعاد را بازی کردهاند. در برخی از مقالات هم کل مراحل توسط شبکه عمیق انجام شده و هیچ مرحله پیش پردازش یا استخراج ویژگی وجود ندارد (End to End Learning). در این مقاله، به این موارد میپردازیم و اینکه کدامیک از شبکهها برای هر یک از این عملیات مناسب هستند.
در مقالات اخیر، شبکههای عمیق مانند ANN, CNN, RNN, AE, GAN در نقشهای مختلفی برای پردازش سیگنال EEG ظاهر شدهاند. هر کدام از این شبکهها بسته به قابلیتهایی که دارند برای کاربردی خاص درپردازش سیگنال در نظر گرفته میشوند.
1-شبکههای عمیق به عنوان استخراج کننده ویژگی
شبکههای عمیق در استخراج ویژگی از سیگنال EEG عملکرد امیدوارکنندهای از خود نشان دادند.
1-1- شبکه عصبی کانولوشنی
برای مثال شبکههای عصبی کانولوشنی (CNN) به طور گستردهای برای استخراج ویژگی از دادهی EEG استفاده میشوند. این شبکهها میتوانند به طور خودکار ویژگیهای سلسله مراتبی را از سیگنالهای خام EEG یاد بگیرند. محققان انواع مختلف معماریهای CNN را برای دیکد سیگنال EEG بررسی کردهاند. پیشرفتهای اخیر در زمینه یادگیری عمیق مانند Batch Normalization و Exponential Linear Unit برای دستیابی به بهترین ویژگیها ضروری هستند. در مقاله 1 از یک شبکه channel-frequency CNN (CFCNN) در ترکیب با تحلیل کمی بازگشتی (RQA) برای تشخیص دقیق سیگنال EEG مربوط به احساسات مختلف استفاده کرده است.
2-1-شبکهی عصبی بازگشتی و خانواده ی آن
همچنین از شبکههای عصبی بازگشتی (RNN) و خانوادهی آن یعنی شبکههای LSTM, GRU و BiLSTM برای استخراج ویژگی از سیگنال EEG از مقالات بهره گرفته شده است. برای مثال در مقاله 2 از یک شبکه BiLSTM (bidirectional Long Short-Term Memory) برای تشخیص سیگنال EEG صرع تشنجی و غیرتشنجی استفاده شده است. معماری این مقاله به شکل زیر بوده است.
همچنین از شبکههای عمیق دیگر مانند Autoencoder (AE) و Generative Adversarial Networks (GANs) نیز برای استخراج ویژگی از سیگنال EEG استفاده شده است.
3-1-شبکه خودرمزنگار و خانواده ی آن
شبکههای Autoencoder یا خودرمزنگار معماریهای شبکه عصبی برای یادگیری بدون ناظر هستند. و شامل یک انکدر هستند که داده را به یک فضای با ابعاد کمتر میبرد (Latent space) و دیکدر که دادهی اصلی را از این بازنمایی میسازد. در زمینه استخراج ویژگی از سیگنال EEG، خودرمزنگار میتواند ویژگیهای مرتبط را از دادهی خام EEG یاد بگیرد. انواع مختلف شبکههای خودرمزنگار مانند Sparse autoencoderو Convolutional autoencoder , recurrent autoencoder را میتوان برای استخراج ویژگی از سیگنال EEG استفاده کرد. برای مثال در مقاله3 از Sparse Autoencoder برای تشخیص احساسات افراد از روی سیگنال EEG استفاده شده است. ساختار sparse Autoencoder به صورت زیر در مقاله آمده است:
همچنین در مقالهای دیگر 4 از شبکههای خودرمزنگار به عنوان استخراج کنندهی ویژگی از سیگنالهای EEG تصور حرکتی (یکی از پارادایمهای BCI) استفاده شده است.
4-1-شبکههای مولد تخاصمی (GAN)
شبکههای GAN از دو بخش Generator (مولد) و Discriminator (تفکیک کننده) تشکیل شدهاند. بخش generator، نمونه دادههای جدید (ویژگیهای EEG) از نویز تصادفی تولید میکند و بخش discriminator سعی میکند تفاوت بین دادهی واقعی و دادهی مصنوعی تولید شده را تشخیص دهد.
در زمینهی استخراج ویژگی از سیگنال EEG، شبکههای GAN برای تولید ویژگیهای EEG مصنوعی که شبیه به دادههای EEG واقعی باشند استفاده میشوند. در مقالهی 5 از شبکههای Autoencoder مبتنی بر GAN برای فیلترینگ دادهی EEG استفاده شده است که به طور موثر، نویز یا سایر اطلاعات نامرتبط را از سیگنالهای EEG حذف میکند.
2-شبکههای عمیق به عنوان End-to-End Learning
در برخی مقالات دیگر، شبکههای عمیق تمام نقشهای پیش پردازش، استخراج ویژگی، انتخاب ویژگی و کاهش ابعاد و کلاسبندی را با هم ایفا میکنند. به این نوع شبکهها که تمامی مراحل یک الگوریتم یادگیری ماشین را با هم انجام میدهند، End-To-End Learning گفته میشود.
1-2-شبکههای عصبی کانولوشنی
در مقاله 6 (این مقاله در دورهی پردازش سیگنال مغزی با کتابخانه MNE-Python پیاده سازی شده است) از چندین شبکه CNN به عنوان End-to-end learning استفاده شده است. در این کار، تنها پیش پردازش اندکی (استخراج باندهای مختلف سیگنال EEG و Normalization) به صورت جداگانه پیاده سازی شده و بقیه مراحل اعم از پیش پردازش و استخراج ویژگی، انتخاب ویژگی و کلاسبندی توسط یک مدل Fusion CNN انجام شده است.
2-2-شبکههای عصبی بازگشتی و خانواده آن
شبکههای LSTM نوعی از شبکههای عصبی بازگشتی هستند (RNN) که دادههای توالی را مدل میکنند. برای تحلیل سیگنال EEG، شبکههای LSTM میتوانند وابستگیهای زمانی و الگوهای آن را از دادهی سری زمانی EEG یاد بگیرند. شبکهی LSTM اغلب برای تشخیص تشنج های صرع، تشخیص احساسات و کلاسبندی مراحل خواب استفاده میشود. در مقالهی 7 از مدل CNN-LSTM برای تشخیص تشنجهای صرع استفاده شده است. معماری مدل پیشنهادی این مقاله به صورت زیر است
3-2-شبکههای خودرمزنگار و خانوادهی آن
مقالهی 8 از یک خودرمزنگار End-to-end برای تشخیص تشنجهای صرعی از روی سیگنال EEG استفاده کرده است. رویکرد مقاله به این صورت است که چندین خودرمزنگار را با توابع هزینه mutually exclusive ترکیب کرده است تا عملکرد تشخیص مدل را برای تشنج های صرع بالا ببرد.
همچنین در مقالهای دیگر 9 با نام EEG2VEC از VAE یا Variational autoencoders استفاده کرده است که بازنماییهای EEG مخصوص هر سابجکت را از سیگنال EEG خام یاد بگیرد و برای این منظور از یک معماری End-to-end بهره گرفته است.
4-2-شبکههای مولد تخاصمی
تا به این تاریخی که این مقاله را مینویسم، مقالهای که از شبکههای GAN و انواع آن برای EEG End-to-End Learning استفاده کرده باشد، پیدا نکردم! اگر شما مقالهای را با این مضمون دیدید برای ما کامنت کنید تا در پستهای بعدی به آن بپردازیم.
همانطور که دیدیم شبکههای عمیق با توجه به قابلیتهای بالایی که دارند میتوانند در تحلیل سیگنال EEG در نقشهای مختلفی ظاهر شوند. میتوان از آنها به عنوان استخراج کننده ویژگی استفاده کرد. یا اینکه تمامی مراحل تحلیل سیگنال به طور یکباره توسط شبکه عمیق انجام شود و هیچ مرحله پیش پردازش یا پس پردازشی نیاز نباشد.
علاوه بر نقش های فوق، شبکههای عمیق همچنین میتوانند در نقش کاهش دهنده ابعاد، کلاسبند یا تولید کننده دادهی مصنوعی EEG به کار گرفته شوند. این نقشها را در مقالات بعدی مورد بررسی قرار خواهیم داد.
دیدگاه ها