محمد نوری زاده چرلو
چطور با داده نامتعادل در آموزش مدلهای یادگیری ماشین مقابله کنیم؟
وقتی یک دادهای دارید که تعداد نمونههای گروهها خیلی متفاوت هستند، یا به اصطلاح یک داده نامتعادل دارید، دقت کلاسبندی به تنهایی به هیچ عنوان نمیتواند پارامتر مناسبی برای ارزیابی باشد. در این حالت بهترین کار اینه که سایر پارامترهای…
تفاوت تکنیک یکی در مقابل همه با تکنیک یکی در مقابل یکی
برخی از طبقهبندهای یادگیری ماشین، مثل SVM برای مسائل دو کلاسه طراحی شدهاند و اگر یکی بخواهد از این الگوریتمها در مسائل چند کلاسه استفاده کند، مجبور است که با کمک تـکنیکهایی طبقهبند را برای مسائل چندکلاسه تعمیم دهد. تکنیک…
انتخاب مدل یادگیری ماشین مناسب با کمک تیغ اوکام
احتمالا تا الان براتون پیش اومده که در یک پروژهای از دو مدل یادگیری ماشین استفاده کردهاید و مشاهده کردید هر دو تقریبا مثل هم عمل میکنند و بعد در انتخاب بین دو مدل به مشکل خوردهاید یا براتون سوال…
انواع واسط مغز و کامپیوتر(غیرتهاجمی-نیمه تهاجمی-تهاجمی)
بسته به اینکه از چه روش برای ثبت سیگنالهای مغزی استفاده میشود، واسط مغز و کامپیوتر را (BCI) را میتوان به سه دسته کلی تقسیمبندی کرد. روشهای زیادی برای ثبت سیگنالهای مغزی وجود دارد که به طور کلی میتوان BCI…
7 راه موثر برای جلوگیری از overfitting در الگوریتمهای یادگیری ماشین
وقتی یک مدل یادگیری ماشین عملکرد خیلی خوبی روی داده آموزشی داشته باشد ولی روی داده جدید عملکرد خیلی پایینی داشته باشد، در این صورت به احتمال بسیار زیاد overfitting رخ داده است. در این مقاله میخواهیم در ابتدا با…
مزایا و معایب 8 معیار فاصله در داده کاوی و یادگیری ماشین
بسیاری از الگوریتمهای نظارت شده و غیرنظارتی، از معیارهای فاصله در پروسه یادگیری استفاده میکنند. برای مثال معیارهایی از قبیل فاصله اقلیدسی در الگوریتمهایی مثل knn, kmeans زیاد استفاده میشود. درک اینکه از کدام معیار فاصله در الگوریتمها استفاده کنیم…
فرق بین انحراف معیار(standard deviation) و خطای استاندارد(standard error)
انحراف معیار(standard deviation) و خطای استاندارد(standard error) هر دو معیاری از پراکندگی هستند. انحراف معیار پراکندگی نمونهها حول میانگین را مشخص میکند. در حالی خطای استاندارد میزان انحراف میانگینهای تخمین زده شده از زیرمجموعههای یک جمعیت را مشخص میکند. در…
تست آماری ttest و مفهوم p-value
تست آماری ttest یک روش انتخاب ویژگی است که برپایه یک فرضیه آماری به ویژگیها براساس تفکیکپذیری آنها یک pvalue اختصاص میدهد و سپس براساس مقدار pvalueها، ویژگیهای مناسب را انتخاب میکند. میخواهیم در این بخش روش آماری ttest و همچنین…
برای کاهش overfitting و underfitting کدام روش یادگیری جمعی استفاده کنیم؟
underfitting و overfitting مدل از چالشهای اساسی مهندسین در پروژه های یادگیری ماشین هست و همیشه سعی میکنیم به نوعی از overfit و یا underfit شدن مدل جلوگیری کنیم. در این بخش توضیح میدهیم که چطور میتوان با کمک تکنیکهای…
برای پیادهسازی مقاله به چه چیزهایی نیاز داریم؟
پیاده سازی مقاله یکی از چالشهای اساسی است که در دانشگاه و محیط کار با آن روبرو هستیم. و همه ما وقتی اولین بار با یک موضوعی روبرو میشویم سردرگم میشویم و نمیدانیم از کجا شروع کنیم. هر کاری را…
چرا میخواهیم از یادگیری جمعی(ensemble learning ) استفاده کنیم؟
یادگیری جمعی(ensemble learning) در حوزه یادگیری ماشین شامل تکنیکهایی هست که در آن برای حل یک مسئله، به جای استفاده از یک ماشین، از چندین ماشین به طور همزمان استفاده میکنند. در این بخش میخواهیم بررسی کنیم که چرا میخواهیم…
فرق بین feature mapping و انتخاب ویژگی (feature selection)
در یک سیستم شناسایی الگو برای کاهش بعد ویژگیها از دو رویکردِ نگاشت ویژگی ( feature mapping ) و انتخاب ویژگی(feature selection) میتوان استفاده کرد، هر دو روش سعی بر کاهش بهینه تعداد ویژگیها دارند، منتهی رویکرد هر کدام متفاوت…