بلاگ علمی

چطور از overfitting جلوگیری کنیم

7 راه موثر برای جلوگیری از overfitting در الگوریتم‌های یادگیری ماشین

وقتی یک مدل یادگیری ماشین عملکرد خیلی خوبی روی داده آموزشی داشته باشد ولی روی داده جدید عملکرد خیلی پایینی داشته باشد، در این صورت به احتمال بسیار زیاد overfitting رخ داده است. در این مقاله میخواهیم در ابتدا با…
معیارهای فاصله

مزایا و معایب 8 معیار فاصله در داده کاوی و یادگیری ماشین

بسیاری از الگوریتمهای نظارت شده و غیرنظارتی، از معیارهای فاصله در پروسه یادگیری استفاده میکنند. برای مثال معیارهایی از قبیل فاصله اقلیدسی در الگوریتمهایی مثل knn, kmeans زیاد استفاده می‌شود. درک اینکه از کدام معیار فاصله در الگوریتمها استفاده کنیم…
فرق بین خطای استاندارد و انحراف معیار

فرق بین انحراف معیار(standard deviation) و خطای استاندارد(standard error)

انحراف معیار(standard deviation) و خطای استاندارد(standard error) هر دو معیاری از پراکندگی هستند. انحراف معیار پراکندگی نمونه‌ها حول میانگین را مشخص می‌کند. در حالی خطای استاندارد میزان انحراف میانگین‌های تخمین زده شده از زیرمجموعه‌های یک جمعیت را مشخص می‌کند. در…
انتخاب ویژگی با ttest و مفهوم pvalue

تست آماری ttest و مفهوم p-value

تست آماری ttest یک روش انتخاب ویژگی است که برپایه یک فرضیه آماری به ویژگی‌ها براساس تفکیک‌‎پذیری آنها یک pvalue اختصاص می‌دهد و سپس براساس مقدار pvalue‌ها، ویژگی‌های مناسب را انتخاب می‌کند. میخواهیم در این بخش روش آماری ttest و همچنین…
نحوه کاهش overfitting و underfitting

برای کاهش overfitting و underfitting کدام روش یادگیری جمعی استفاده کنیم؟

underfitting  و overfitting مدل از چالشهای اساسی مهندسین در پروژه های یادگیری ماشین هست و همیشه سعی میکنیم به نوعی از overfit و یا underfit شدن مدل جلوگیری کنیم. در این بخش توضیح میدهیم که چطور میتوان با کمک تکنیکهای…
آموزش اصول پیاده سازی مقاله

برای پیاده‌سازی مقاله به چه چیزهایی نیاز داریم؟

پیاده سازی مقاله یکی از چالشهای اساسی است که در دانشگاه و محیط کار با آن روبرو هستیم. و همه ما وقتی اولین بار با یک موضوعی روبرو میشویم سردرگم میشویم و نمیدانیم از کجا شروع کنیم. هر کاری را…
یادگیری جمعی

چرا  میخواهیم از یادگیری جمعی(ensemble learning ) استفاده کنیم؟

یادگیری جمعی(ensemble learning) در حوزه یادگیری ماشین شامل تکنیکهایی هست که در آن برای حل یک مسئله، به جای استفاده از یک ماشین، از چندین ماشین به طور همزمان استفاده میکنند. در این بخش میخواهیم بررسی کنیم که چرا می‌خواهیم…
فرق بین کاهش بعد و انتخاب ویژگی

فرق بین feature mapping و انتخاب ویژگی (feature selection)

در یک سیستم شناسایی الگو برای کاهش بعد ویژگی‌ها از دو رویکردِ نگاشت ویژگی ( feature mapping ) و انتخاب ویژگی(feature selection) میتوان استفاده کرد، هر دو روش سعی بر کاهش بهینه تعداد ویژگی‌ها دارند، منتهی رویکرد هر کدام متفاوت…
ثبت سیگنال eeg با الکترودهای خالکوبی شده

اندازه گیری طولانی مدت سیگنال EEG توسط الکترود های خال کوبی شده

به گفته گرسو توگراز، برای اولین بار مشخص شده است که الکترودهای خال کوبی شده، فعالیت EEG را بدون نیاز به ژل رسانا و همچنین بدون نیاز به الکترودهای سنتی، اندازه گیری می کند. مهندسان اروپایی با استفاده از الکترودهای…
کاهش بعد

 چرا کاهش بعد (feature conditioning ) در پروژه های شناسایی الگو امکان‌پذیر است؟

در یک سیستم شناسایی الگو، کاهش بعد در مرحله چهارم بین طبقه‌بندی و استخراج ویژگی قرار می‌گیرید و هدفش کاهش تعداد ویژگی های استخراج شده می‌باشد تا کار تصمیم گیری را برای طبقه‌بند تسهیل کند. در این بخش میخواهیم این…
استخراج ویژگی

استخراج ویژگی در شناسایی الگو

ویژگی یک پارامتر یا خصیصه قابل اندازه گیری از پدیده‌ای هست که مشاهده می‌کنیم. ویژگی مشخصات مهم یک پدیده(object) را کمّی می‌کند. به فرایند اندازه‌گیری این پارامترها استخراج ویژگی گفته می‌شود. بخش استخراج ویژگی در همان ابتدای یک سیستم شناسایی…
شناسایی الگو چیست

شناسایی الگو چیست؟

شناسایی الگو یک فرایند شناختی است که در مغز ما زمانی که با برخی اطلاعاتی روبرو می‌شویم که با اطلاعات ذخیره شده در حافظه ما مطابقت دارد اتفاق می افتد. در علوم کامپیوتر، شناسایی الگو یک فرایند علمی است که…