اخبار علمی

دلایل محبوبیت ماشین بردار پشتیبان(svm)

چرا ماشین بردار پشتیبان (SVM) در بین طبقه‌بندها جزء بهترینا هست؟

ماشین بردار پشتیبان(svm) یکی از معروفترین الگوریتمها در مسائل طبقه‌بندی هست که برای اولین بار توسط آقای Vladimir Vapnik در سال 1995 با عنوان support vectors networks مطرح شد. SVM در ابتدا برای مسائل طبقه‌بندی دو کلاسه خطی مطرح شده…
چطور با داده‌های نامتعادل در آموزش مدلهای یادگیری ماشین مقابله کنیم؟

چطور با داده‌ نامتعادل در آموزش مدلهای یادگیری ماشین مقابله کنیم؟

وقتی یک داده‌ای دارید که تعداد نمونه‌های گروه‌ها خیلی متفاوت هستند، یا به اصطلاح یک داده نامتعادل دارید، دقت کلاسبندی به تنهایی به هیچ عنوان نمی‌تواند پارامتر مناسبی برای ارزیابی باشد. در این حالت بهترین کار اینه که سایر پارامترهای…
تکنیک یکی در مقابل همه

تفاوت تکنیک یکی در مقابل همه با تکنیک یکی در مقابل یکی

برخی از طبقه‌بندهای یادگیری ماشین، مثل SVM برای مسائل دو کلاسه طراحی شده‌اند و اگر یکی بخواهد از این الگوریتمها در مسائل چند کلاسه استفاده کند، مجبور است که با کمک تـکنیکهایی طبقه‌بند را برای مسائل چندکلاسه تعمیم دهد. تکنیک…
انتخاب مدل مناسب با تیغ اکام در یادگیری ماشین

انتخاب مدل یادگیری ماشین مناسب با کمک تیغ اوکام

احتمالا تا الان براتون پیش اومده که در یک پروژه‌ای از دو مدل یادگیری ماشین استفاده کرده‌اید و مشاهده کردید هر دو تقریبا مثل هم عمل می‌کنند و بعد در انتخاب بین دو مدل به مشکل خورده‌اید یا براتون سوال…
انواع واسط مغز و کامپیوتر

انواع واسط مغز و کامپیوتر(غیرتهاجمی-نیمه تهاجمی-تهاجمی)

بسته به اینکه از چه روش برای ثبت سیگنالهای مغزی استفاده می‌شود، واسط مغز و کامپیوتر را (BCI) را میتوان به سه دسته کلی تقسیم‌بندی کرد. روشهای زیادی برای ثبت سیگنالهای مغزی وجود دارد که به طور کلی میتوان BCI…
چطور از overfitting جلوگیری کنیم

7 راه موثر برای جلوگیری از overfitting در الگوریتم‌های یادگیری ماشین

وقتی یک مدل یادگیری ماشین عملکرد خیلی خوبی روی داده آموزشی داشته باشد ولی روی داده جدید عملکرد خیلی پایینی داشته باشد، در این صورت به احتمال بسیار زیاد overfitting رخ داده است. در این مقاله میخواهیم در ابتدا با…
معیارهای فاصله

مزایا و معایب 8 معیار فاصله در داده کاوی و یادگیری ماشین

بسیاری از الگوریتمهای نظارت شده و غیرنظارتی، از معیارهای فاصله در پروسه یادگیری استفاده میکنند. برای مثال معیارهایی از قبیل فاصله اقلیدسی در الگوریتمهایی مثل knn, kmeans زیاد استفاده می‌شود. درک اینکه از کدام معیار فاصله در الگوریتمها استفاده کنیم…
فرق بین خطای استاندارد و انحراف معیار

فرق بین انحراف معیار(standard deviation) و خطای استاندارد(standard error)

انحراف معیار(standard deviation) و خطای استاندارد(standard error) هر دو معیاری از پراکندگی هستند. انحراف معیار پراکندگی نمونه‌ها حول میانگین را مشخص می‌کند. در حالی خطای استاندارد میزان انحراف میانگین‌های تخمین زده شده از زیرمجموعه‌های یک جمعیت را مشخص می‌کند. در…
انتخاب ویژگی با ttest و مفهوم pvalue

تست آماری ttest و مفهوم p-value

تست آماری ttest یک روش انتخاب ویژگی است که برپایه یک فرضیه آماری به ویژگی‌ها براساس تفکیک‌‎پذیری آنها یک pvalue اختصاص می‌دهد و سپس براساس مقدار pvalue‌ها، ویژگی‌های مناسب را انتخاب می‌کند. میخواهیم در این بخش روش آماری ttest و همچنین…
نحوه کاهش overfitting و underfitting

برای کاهش overfitting و underfitting کدام روش یادگیری جمعی استفاده کنیم؟

underfitting  و overfitting مدل از چالشهای اساسی مهندسین در پروژه های یادگیری ماشین هست و همیشه سعی میکنیم به نوعی از overfit و یا underfit شدن مدل جلوگیری کنیم. در این بخش توضیح میدهیم که چطور میتوان با کمک تکنیکهای…
آموزش اصول پیاده سازی مقاله

برای پیاده‌سازی مقاله به چه چیزهایی نیاز داریم؟

پیاده سازی مقاله یکی از چالشهای اساسی است که در دانشگاه و محیط کار با آن روبرو هستیم. و همه ما وقتی اولین بار با یک موضوعی روبرو میشویم سردرگم میشویم و نمیدانیم از کجا شروع کنیم. هر کاری را…
یادگیری جمعی

چرا  میخواهیم از یادگیری جمعی(ensemble learning ) استفاده کنیم؟

یادگیری جمعی(ensemble learning) در حوزه یادگیری ماشین شامل تکنیکهایی هست که در آن برای حل یک مسئله، به جای استفاده از یک ماشین، از چندین ماشین به طور همزمان استفاده میکنند. در این بخش میخواهیم بررسی کنیم که چرا می‌خواهیم…