فرق بین feature mapping و انتخاب ویژگی (feature selection)


در یک سیستم شناسایی الگو برای کاهش بعد ویژگی‌ها از دو رویکردِ نگاشت ویژگی ( feature mapping ) و انتخاب ویژگی(feature selection) میتوان استفاده کرد، هر دو روش سعی بر کاهش بهینه تعداد ویژگی‌ها دارند، منتهی رویکرد هر کدام متفاوت است. در رویکرد feature mapping ویژگی ها باهم ترکیب شده و به یک فضای جدید نگاشت پیدا کرده و در فضای جدید انتخاب ویژگی انجام می‌شود، ولی در رویکرد انتخاب ویژگی در همان حوزه اصلی ویژگی‌های مناسب انتخاب می‌شوند.

در بخش قبل اهمیت feature conditioning را توضیح داده و در مورد اینکه چرا میتوان کاهش بعد انجام داد صحبت کردیم، حال در این بخش می‌خواهیم تفاوت بین feature mapping و انتخاب ویژگی (feature selection) را توضیح دهیم.

 

نگاشت ویژگی(feature mapping)

در این رویکرد ویژگی ها باهم به صورت خطی یا غیرخطی ترکیب شده و ویژگی‌های جدیدی می‌سازند، به عبارتی ویژگی‌ها به یک حوزه جدید نگاشت پیدا می‌کنند.

نگاشت

از ترکیب ویژگی‌ها یک تعداد ویژگی جدید ساخته می‌شود، و اهمیت این ویژگی‌ها بستگی به این دارد که ویژگی‌های فضای اصلی به چه صورت باهم ترکیب شده‌اند.

مزیت feature mapping

در این رویکرد از اطلاعات همه ویژگی‌ها استفاده می‌شود، به ازای ترکیب‎های مختلف(اینکه هر ویژگی چه سهمی در ساخت ویژگی جدید داشته باشد) ویژگی‌های جدیدی ساخته می‌شود. حال اگر ترکیب مناسب باشد، ویژگی خوبی ساخته خواهد شد و اگر ترکیب بدی باشد، ویژگی بدی ساخته خواهد شد. خوبی رویکرد feature mapping این است که اگر همه ویژگی‌ها اطلاعات داشته باشند، تاثیرشان در مسئله از بین نمی رود.

 

عیب feature mapping

عیب این رویکردها این است که کاربر دیگر با ویژگی‌های فضای اصلی سر و کار ندارد و عملا تجزیه و تحلیل ویژگی‌های فضای جدید برای فرد امکان پذیر نیست.

برای مثال شما ویژگی رنگ، عرض، و طول ماهی را از تصاویر ماهی استخراج کرده‌اید، از ترکیب این سه ویژگی، ویژگی‌های جدیدی ساخته شده است که جنس آنها برای کاربر معلوم نیست!  فضا کلا عوض شده است!

تجزیه و تحلیل ویژگی‌ها در فضای جدید عملا برای پزشکان و افرادی که می‌خواهند خودشان نیز کنار ماشین ویژگی‎ها را تجزیه و تحلیل کنند، امکان پذیر نیست.

حتی اگر قرار باشد، یک ماشین تصمیم‌گیری را انجام دهد، باز بسیاری از پزشکان نمی‌توانند به ماشین اعتماد کنند و  می‌خواهند خودشان هم مقادیر ویژگی ها بررسی کنند تا متوجه شوند که چه اتفاقی افتاده است که ماشین چنین تصمیمی گرفته ، مثلا ماشین گفته تومور بدخیم هست یا خوش خیم. پزشک می‌خواهد بداند که چرا ماشین همچین تصمیمی گرفته، مقادیر ویژگی‌ها چی بوده که ماشین به چنین تصمیمی رسیده است!

 

انتخاب ویژگی (feature selection)

در این رویکرد، بدون اینکه ویژگی‌ها به یک فضای جدید انتقال یاند، کاهش بعد اتفاق می‌افتد. در این رویکرد معیارهای مختلفی ارائه شده‌اند که هر کدام به ویژگی‌ها براساس میزان اطلاعاتی که به مسئله ارائه می‌دهند یک امتیازی(مرتبه) می‌دهند. سپس ویژگی‌ها را براساس مرتبه آنها مرتب کرده و بهترین ها را انتخاب می‌کنند.

مزیت انتخاب ویژگی

فضای ویژگی تغییر نمی‌کند،  و ویژگی‌های انتخاب شده برای کاربر قابل درک هست و میتواند کنار ماشین تجزیه و تحلیلهای خودش را نیز انجام دهد.

عیب انتخاب ویژگی

اگر یک حالتی باشد که همه ویژگی ها اطلاعات داشته باشند، در این رویکرد ویژگی‌هایی که اطلاعات کمی دارند، حذف می شوند، ولی در هر صورت با اینکه اطلاعات کم بوده، حذف می‌شوند. اطلاعات مهم هستند و برای ما ارزشمند! هر چقدر هم که کم باشند باز مهم هستند و نباید حذف کنیم، ولی در این رویکرد بعضی مواقع چاره‌ای نیست و اگر بنا باشد کاهش بعدی اتفاق بیافته ناگزیریم بخشی از اطلاعات را حذف کنیم!

 مزیت دیگر رویکردهای مبتنی بر انتخاب ویژگی این هست که ماشین هم می‌تواند در پروسه انتخاب ویژگی‌ها سهیم باشد. کار تصمیم گیری را ماشین انجام میدهد بهتر است که در جریان انتخاب ویژگی باشد. که این کمک میکند، ماشین ویژگی‌های مناسب برای خودش را انتخاب کند. البته در رویکرد wrapper methods این اتفاق می‌افتد که بعدا مفصل در مورد این موضوع صحبت خواهیم کرد.

مثال زیر میتواند یک مثال ساده برای توضیح تفاوت feature mapping و feature selection باشد. فرض کنید گوجه‌های زیر هر کدام یک ویژگی هستند.

فرق بین کاهش بعد و انتخاب ویژگی

در feature mapping همه ویژگی ها به صورت خطی یا غیر خطی ترکیب شده و ویژگی های جدید می‌سازند در این مثال مثل این می‌ماند که شما با ترکیب‌های مختلف این گوجه‌ها ربـّهای مختلفی بسازید. بعد از بین ربـّهای ساخته شده از ترکیب مختلف این گوجه‌ها، بهترین ها را انتخاب کنید الان فضا کامل عوض شده، و جنس ویژگی ها تغییر کرده است!

فرق بین کاهش بعد و انتخاب ویژگی

ولی اگر از رویکرد انتخاب ویژگی میخواستیم استفاده کنیم، در همون فضا از بین گوجه‌ها، بهترین‌ها را انتخاب می‌کنیم! ورودی گوجه هست، خروجی هم باز گوجه هست. جنس ویژگی‌ها تغییر کرده است. ولی در در feature mapping ورودی گوجه هست ولی خروجی رب هست. جنس ویژگی‌ها کاملا تغییر کرده است.

 


دیدگاه ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

code