الگوریتم ensemble RCSSP برای طبقهبندی سیگنال EEG تصور حرکتی
- دسته:اخبار علمی
- هما کاشفی
الگوریتم CSP (فیلتر مکانی مشترک) روشی برای طبقه بندی سیگنال EEG مبتنی بر تصور حرکتی است. این الگوریتم با وجود کارایی خوبی که نسبت به سایر روشهای استخراج ویژگی دارد اما با ایراداتی چون احتمال بالای overfitting روبروست که میتواند عملکرد آن را تحت تأثیر قرار دهد. ما در این مطالعه سعی کردهایم با ارائهی رویکردهایی احتمال بروز overfitting الگوریتم CSP را کم کنیم و دقت طبقه بندی سیگنال EEG مبتنی بر تصور حرکتی را افزایش دهیم.
الگوریتم CSP
(فیلترهای مکانی مشترک) CSP روشی رایج برای طبقه بندی نوع حرکت تصور شده در مجموعه دادههای تصور حرکتی سیستم واسط مغز کامپیوتر (BCI) است. این الگوریتم برای اولین بار به منظور تشخیص غیرطبیعی بودن سیگنال EEG به کار گرفته شد و سپس در جداسازی کلاسهای مربوط به واسط مغز کامپیوتر و الگوهای تصور حرکت دو کلاسه نیز مورد استفاده قرار گرفت. روش CSP با اعمال فیلترهای مکانی به سیگنال معزی، واریانس سیگنالها را در کلاس اول ماکزیمم و به طور همزمان در کلاس دیگر مینیمم میکند. سپس از سیگنالهای فیلتر شده، ویژگیهای کلاس اول را استخراج میکند. این کار به طور معکوس نیز اتفاق میافتد. یک سری از فیلترهای مکانی، واریانس سیگنال را در کلاس دوم ماکزیمم و به طور همزمان در کلاس اول مینیمم میکنند. سپس با استفاده از سیگنالهای فیلتر شده، ویژگیهای کلاس دوم را استخراج میکنند.
شکل 1: نحوهی نگاشت داده با الگوریتم CSP (منبع)
الگوریتم CSP با وجود عملکرد خوبی که نسبت به سایر روشهای استخراج ویژگی مرسوم برای دادههای EEG تصور حرکتی دارد، ایراداتی دارد که یکی از مهمترین آنها، Overfitting است. زمانی که تعداد ترایالها کم باشد و یا ترایالها نویزی باشد، احتمال آنکه الگوریتم Overfit شود بسیار بالا میرود.
روش ارائه شده(Ensemble RCSSP)
ما در این مطالعه سعی کردهایم سیستمی مبتنی بر CSP طراحی کنیم که عملکرد بهتری داشته باشد. برای این منظور در ابتدا روشی ارائه دادهایم که پتانسیل Overfitting الگوریتم CSP را کاهش دهد و سپس با کمک روشهای انتخاب ویژگی، کانالهای بهینه را برای هر سابجکت انتخاب کردهایم. با ترکیب این دو بخش، سیستم طراحی شده دقت بالایی دارد.
کاهش Overfitting فیلتر مکانی CSP
یادگیری جمعی، شاخهای از یادگیری ماشین است که در آن به جای استفاده از یک مدل، از ترکیب چندین مدل برای انجام یک تسک استفاده میکنند. طبق نتایج مطالعات، با کمک این تکنیکها میتوان عملکرد سیستم طراحی شده را به طور قابل توجهی افزایش داد.
شکل 2: یادگیری جمعی(منبع)
در میان روشهای یادگیری جمعی، از تکنیکهای bagging و boosting به دلیل کارایی بالایی که دارند بسیار استفاده میشود. همانطور که قبلاً گفته شد در هر دو تکنیک، به جای یک مدل، از چندین مدل برای تصمیمگیری استفاده میشود و مدل پایه در هر دو، یک نوع است.
هدف تکنیک boosting این است که با ترکیب چندین مدل ضعیف، سیستمی طراحی شود که عملکرد بالایی داشته باشد و در نهایت مدلی ضعیف را به مدل خیلی قوی تبدیل کند. هدف تکنیک bagging این است که چندین مدل قوی که احتمال overfitting آنها زیاد است را با هم ترکیب کند و سیستمی طراحی شود که عملکرد مناسبی داشته باشد.
از آنجاییکه احتمال Overfitting الگوریتم CSP زیاد است، ما در این مطالعه برای اولین بار از تکنیک bagging استفاده کردیم و عملکرد مدل نهایی را افزایش دادیم. در مطالعات انجام شدهی قبلی از تکنیکهای یادگیری جمعی استفاده کرده بودند، اما در آن مطالعات، بعد از اعمال الگوریتم CSP روی داده و استخراج ویژگی، از روشهایی مانند Adaboost برای تقویت طبقه بند استفاده کردند. ما در این مطالعه، علاوه بر طبقهبند از خود الگوریتم CSP هم به عنوان مدل پایه استفاده کردهایم، یعنی به جای آنکه از یک CSP استفاده کنیم از چندین CSP با استفاده از تکنیک Bagging استفاده کردیم. نحوهی استفاده از تکنیک Bagging در مطالعه در شکل 2 آمده است.
شکل 3: استفاده از CSP و Decision Tree به عنوان مدل پایه تکنیک Bagging در طبقه بندی سیگنال EEG مبتنی بر تصور حرکتی.
تقویت مدل پایه
در ادامه برای تقویت مدل نهایی، الگوریتم پایه را نیز بهبود دادیم. برای اینکار الگوریتم RCSP و CSSP را باهم ترکیب کرده و الگوریتم RCSSP را ارائه دادیم.
یکی دیگر از ایراداتی که الگوریتم CSP دارد این است در محاسبه فیلترها فقط اطلاعات مکانی را استفاده میکند. الگوریتم CSSP یک روش بهبود یافته شده CSP هست که علاوه بر اطلاعات مکانی، از اطلاعات فرکانسی نیز استفاده میکند.
الگوریتم RCSP CSSP یک روش بهبود یافته شده CSP هست که با هدف کاهش overfitting الگوریتم CSP ارائه شده است. ما با اینکه از تکنیک bagging برای حل این مسئله استفاده کرده ایم، ولی مسلما اگر مدل پایه هم خودش تا حدودی بتواند مسئله overfitting را حل کند، نتیجه خیلی بهتر خواهد شد.برای همین ما در این مطالعه برای داشتن یک مدل پایه قوی، الگوریتم CSSP و RCSP را باهم ترکیب کردیم و مدل RCSSP را ارائه دادیم.
در ادامه به جای الگوریتم CSP از الگوریتم RCSSP به عنوان مدل پایه در تکنیک bagging استفاده کردیم. طبقه بندی استفاده شده هم طبقه بند decision tree هست و دلیلش هم برمیگرده به خاصیت تکینک بگینیگ! باید مدلهایی استفاده شوند که پتانسیل overfitting بالایی دارند. در آزمایشات مقاله نشان دادیم که در رویکرد ارائه شده، طبقه بندی درختی بهتر از SVM عمل میکند.
شکل 4: الگوریتم Ensemble RCSSP ارائه شده(منبع)
در این مطالعه از دو تا پایگاه داده معتبر سایت BCI competition استفاده کردیم و نتایج آزمایشات نشان میدهند که رویکرد ارائه شده نسبت به سایر روشها عملکرد بهتری دارد.
دیدگاه ها