فرق بین feature mapping و انتخاب ویژگی (feature selection)
در یک سیستم شناسایی الگو برای کاهش بعد ویژگیها از دو رویکردِ نگاشت ویژگی ( feature mapping ) و انتخاب ویژگی(feature selection) میتوان استفاده کرد، هر دو روش سعی بر کاهش بهینه تعداد ویژگیها دارند، منتهی رویکرد هر کدام متفاوت است. در رویکرد feature mapping ویژگی ها باهم ترکیب شده و به یک فضای جدید نگاشت پیدا کرده و در فضای جدید انتخاب ویژگی انجام میشود، ولی در رویکرد انتخاب ویژگی در همان حوزه اصلی ویژگیهای مناسب انتخاب میشوند.
در بخش قبل اهمیت feature conditioning را توضیح داده و در مورد اینکه چرا میتوان کاهش بعد انجام داد صحبت کردیم، حال در این بخش میخواهیم تفاوت بین feature mapping و انتخاب ویژگی (feature selection) را توضیح دهیم.
نگاشت ویژگی(feature mapping)
در این رویکرد ویژگی ها باهم به صورت خطی یا غیرخطی ترکیب شده و ویژگیهای جدیدی میسازند، به عبارتی ویژگیها به یک حوزه جدید نگاشت پیدا میکنند.
از ترکیب ویژگیها یک تعداد ویژگی جدید ساخته میشود، و اهمیت این ویژگیها بستگی به این دارد که ویژگیهای فضای اصلی به چه صورت باهم ترکیب شدهاند.
مزیت feature mapping
در این رویکرد از اطلاعات همه ویژگیها استفاده میشود، به ازای ترکیبهای مختلف(اینکه هر ویژگی چه سهمی در ساخت ویژگی جدید داشته باشد) ویژگیهای جدیدی ساخته میشود. حال اگر ترکیب مناسب باشد، ویژگی خوبی ساخته خواهد شد و اگر ترکیب بدی باشد، ویژگی بدی ساخته خواهد شد. خوبی رویکرد feature mapping این است که اگر همه ویژگیها اطلاعات داشته باشند، تاثیرشان در مسئله از بین نمی رود.
عیب feature mapping
عیب این رویکردها این است که کاربر دیگر با ویژگیهای فضای اصلی سر و کار ندارد و عملا تجزیه و تحلیل ویژگیهای فضای جدید برای فرد امکان پذیر نیست.
برای مثال شما ویژگی رنگ، عرض، و طول ماهی را از تصاویر ماهی استخراج کردهاید، از ترکیب این سه ویژگی، ویژگیهای جدیدی ساخته شده است که جنس آنها برای کاربر معلوم نیست! فضا کلا عوض شده است!
تجزیه و تحلیل ویژگیها در فضای جدید عملا برای پزشکان و افرادی که میخواهند خودشان نیز کنار ماشین ویژگیها را تجزیه و تحلیل کنند، امکان پذیر نیست.
حتی اگر قرار باشد، یک ماشین تصمیمگیری را انجام دهد، باز بسیاری از پزشکان نمیتوانند به ماشین اعتماد کنند و میخواهند خودشان هم مقادیر ویژگی ها بررسی کنند تا متوجه شوند که چه اتفاقی افتاده است که ماشین چنین تصمیمی گرفته ، مثلا ماشین گفته تومور بدخیم هست یا خوش خیم. پزشک میخواهد بداند که چرا ماشین همچین تصمیمی گرفته، مقادیر ویژگیها چی بوده که ماشین به چنین تصمیمی رسیده است!
انتخاب ویژگی (feature selection)
در این رویکرد، بدون اینکه ویژگیها به یک فضای جدید انتقال یاند، کاهش بعد اتفاق میافتد. در این رویکرد معیارهای مختلفی ارائه شدهاند که هر کدام به ویژگیها براساس میزان اطلاعاتی که به مسئله ارائه میدهند یک امتیازی(مرتبه) میدهند. سپس ویژگیها را براساس مرتبه آنها مرتب کرده و بهترین ها را انتخاب میکنند.
مزیت انتخاب ویژگی
فضای ویژگی تغییر نمیکند، و ویژگیهای انتخاب شده برای کاربر قابل درک هست و میتواند کنار ماشین تجزیه و تحلیلهای خودش را نیز انجام دهد.
عیب انتخاب ویژگی
اگر یک حالتی باشد که همه ویژگی ها اطلاعات داشته باشند، در این رویکرد ویژگیهایی که اطلاعات کمی دارند، حذف می شوند، ولی در هر صورت با اینکه اطلاعات کم بوده، حذف میشوند. اطلاعات مهم هستند و برای ما ارزشمند! هر چقدر هم که کم باشند باز مهم هستند و نباید حذف کنیم، ولی در این رویکرد بعضی مواقع چارهای نیست و اگر بنا باشد کاهش بعدی اتفاق بیافته ناگزیریم بخشی از اطلاعات را حذف کنیم!
مزیت دیگر رویکردهای مبتنی بر انتخاب ویژگی این هست که ماشین هم میتواند در پروسه انتخاب ویژگیها سهیم باشد. کار تصمیم گیری را ماشین انجام میدهد بهتر است که در جریان انتخاب ویژگی باشد. که این کمک میکند، ماشین ویژگیهای مناسب برای خودش را انتخاب کند. البته در رویکرد wrapper methods این اتفاق میافتد که بعدا مفصل در مورد این موضوع صحبت خواهیم کرد.
مثال زیر میتواند یک مثال ساده برای توضیح تفاوت feature mapping و feature selection باشد. فرض کنید گوجههای زیر هر کدام یک ویژگی هستند.
در feature mapping همه ویژگی ها به صورت خطی یا غیر خطی ترکیب شده و ویژگی های جدید میسازند در این مثال مثل این میماند که شما با ترکیبهای مختلف این گوجهها ربـّهای مختلفی بسازید. بعد از بین ربـّهای ساخته شده از ترکیب مختلف این گوجهها، بهترین ها را انتخاب کنید الان فضا کامل عوض شده، و جنس ویژگی ها تغییر کرده است!
ولی اگر از رویکرد انتخاب ویژگی میخواستیم استفاده کنیم، در همون فضا از بین گوجهها، بهترینها را انتخاب میکنیم! ورودی گوجه هست، خروجی هم باز گوجه هست. جنس ویژگیها تغییر کرده است. ولی در در feature mapping ورودی گوجه هست ولی خروجی رب هست. جنس ویژگیها کاملا تغییر کرده است.
دیدگاه ها