یادگیری ماشین

چطور از overfitting جلوگیری کنیم

7 راه موثر برای جلوگیری از overfitting در الگوریتم‌های یادگیری ماشین

وقتی یک مدل یادگیری ماشین عملکرد خیلی خوبی روی داده آموزشی داشته باشد ولی روی داده جدید عملکرد خیلی پایینی داشته باشد، در این صورت به احتمال بسیار زیاد overfitting رخ داده است. در این مقاله میخواهیم در ابتدا با…
معیارهای فاصله

مزایا و معایب 8 معیار فاصله در داده کاوی و یادگیری ماشین

بسیاری از الگوریتمهای نظارت شده و غیرنظارتی، از معیارهای فاصله در پروسه یادگیری استفاده میکنند. برای مثال معیارهایی از قبیل فاصله اقلیدسی در الگوریتمهایی مثل knn, kmeans زیاد استفاده می‌شود. درک اینکه از کدام معیار فاصله در الگوریتمها استفاده کنیم…
فرق بین خطای استاندارد و انحراف معیار

فرق بین انحراف معیار(standard deviation) و خطای استاندارد(standard error)

انحراف معیار(standard deviation) و خطای استاندارد(standard error) هر دو معیاری از پراکندگی هستند. انحراف معیار پراکندگی نمونه‌ها حول میانگین را مشخص می‌کند. در حالی خطای استاندارد میزان انحراف میانگین‌های تخمین زده شده از زیرمجموعه‌های یک جمعیت را مشخص می‌کند. در…
انتخاب ویژگی با ttest و مفهوم pvalue

تست آماری ttest و مفهوم p-value

تست آماری ttest یک روش انتخاب ویژگی است که برپایه یک فرضیه آماری به ویژگی‌ها براساس تفکیک‌‎پذیری آنها یک pvalue اختصاص می‌دهد و سپس براساس مقدار pvalue‌ها، ویژگی‌های مناسب را انتخاب می‌کند. میخواهیم در این بخش روش آماری ttest و همچنین…
یادگیری جمعی

چرا  میخواهیم از یادگیری جمعی(ensemble learning ) استفاده کنیم؟

یادگیری جمعی(ensemble learning) در حوزه یادگیری ماشین شامل تکنیکهایی هست که در آن برای حل یک مسئله، به جای استفاده از یک ماشین، از چندین ماشین به طور همزمان استفاده میکنند. در این بخش میخواهیم بررسی کنیم که چرا می‌خواهیم…
فرق بین کاهش بعد و انتخاب ویژگی

فرق بین feature mapping و انتخاب ویژگی (feature selection)

در یک سیستم شناسایی الگو برای کاهش بعد ویژگی‌ها از دو رویکردِ نگاشت ویژگی ( feature mapping ) و انتخاب ویژگی(feature selection) میتوان استفاده کرد، هر دو روش سعی بر کاهش بهینه تعداد ویژگی‌ها دارند، منتهی رویکرد هر کدام متفاوت…
کاهش بعد

 چرا کاهش بعد (feature conditioning ) در پروژه های شناسایی الگو امکان‌پذیر است؟

در یک سیستم شناسایی الگو، کاهش بعد در مرحله چهارم بین طبقه‌بندی و استخراج ویژگی قرار می‌گیرید و هدفش کاهش تعداد ویژگی های استخراج شده می‌باشد تا کار تصمیم گیری را برای طبقه‌بند تسهیل کند. در این بخش میخواهیم این…
استخراج ویژگی

استخراج ویژگی در شناسایی الگو

ویژگی یک پارامتر یا خصیصه قابل اندازه گیری از پدیده‌ای هست که مشاهده می‌کنیم. ویژگی مشخصات مهم یک پدیده(object) را کمّی می‌کند. به فرایند اندازه‌گیری این پارامترها استخراج ویژگی گفته می‌شود. بخش استخراج ویژگی در همان ابتدای یک سیستم شناسایی…
شناسایی الگو چیست

شناسایی الگو چیست؟

شناسایی الگو یک فرایند شناختی است که در مغز ما زمانی که با برخی اطلاعاتی روبرو می‌شویم که با اطلاعات ذخیره شده در حافظه ما مطابقت دارد اتفاق می افتد. در علوم کامپیوتر، شناسایی الگو یک فرایند علمی است که…
یادگیری جمعی

یادگیری جمعی (ensemble learning)

یادگیری جمعی (ensemble learning) حوزه‌ای در یادگیری ماشین است که در این حوزه تکنیک‌هایی مطرح شده است که به کمک آنها از چندین مدل به صورت ترکیبی و همزمان جهت تصمیم گیری استفاده می‌کنند تا توان مدل در تخمین خروجی…
چطور ویژگی استخراج کنیم؟

چطور ویژگی استخراج کنیم؟

در این بخش می‌خواهیم مسئله اطلاعات مشترک رو بررسی کنیم. اطلاعات مشترک اطلاعاتی هستند که در پروژه‌های شناسایی الگو برای الگوریتمهای یادگیری ماشین گمراه کننده هستند و کار تصمیم گیری را برای این الگوریتمها دشوار میکنند. میخواهیم در این جلسه…
آموزش knn

مروری مختصر بر الگوریتم نزدیکترین همسایه(KNN)

Knn مخفف عبارت k nearest neighbors است و برای تخمین خروجی داده جدید از  k تا نزدیک ترین همسایه ی نمونه جدید در داده های آموزش کمک می گیرد.