جلسه‌ی پنجم: تعیین نرخ یادگیری پس انتشار خطا(Back propagation)

محمد نوری زاده چرلو
10 بهمن 1398

بررسی عیب قانون یادگیری پس انتشار خطا(Back propagation)

در جلسه چهارم تئوری الگوریتم معروف پس انتشار خطا را آموزش داده در متلب به صورت مرحله به مرحله پیاده‌سازی کرده و چندین پروژه عملی از جلمه تشخیص سرطان سینه (پروژه عملی طبقه‌بندی) و پیش بینی میزان آلودگی هوا (پروژه عملی رگرسیون) با استفاده از شبکه عصبی پرسپترون چندلایه به صورت گام به گام در متلب پیاده‌سازی کردیم. الگوریتم پس انتشار خطا همانند LMS از گرادیان نزولی برای تنظیم وزنهای سیناپسی استفاده می‌کند. الگوریتم گرادیان نزولی در جهت شیب منفی خطا با یک گامی(نرخ یادگیری) حرکت می‌کند تا به مقدار بهینه برسد. مقدار بهینه جایی است که شیب خطا صفر شود. در حالت ایده آل با تعیین یک نرخ یادگیری مناسب می‌توان به خطای حداقل رسید. ولی در پروژه‌های عملی تعیین نرخ یادگیری بسیار سخت و چالش برانگیز است، زیرا که اگه نرخ یادگیری کم انتخاب شود، الگوریتم ممکن است در مینیمم‌های محلی گیر کند (زیرا که مینیمم محلی خواصی شبیه به مینیمم اصلی دارند و در این مناطق نیز شیب خطا صفر است و الگوریتم به اشتباه فکر می‌کند که به مقدار بهینه رسیده است) و در نتیجه شبکه به درستی آموزش نمی‌بیند و یا اگر نرخ یادگیری بزرگ انتخاب شود امکان دارد شبکه به حالت نوسانی و ناپایدار برسد و در نتیجه همگرا نشده و آموزش نبیند. در این جلسه چالش‌های تعیین نرخ یادگیری را توضیح می‌دهیم و در ادامه چند روش ساده از قبیل ترم ممنتوم، search then converge و time variant را برای حل این مسئله طبق مطالب کتاب ارائه می‌دهیم و در متلب پیاده‌سازی می‌کنیم و مزایا و معایب هر روش را توضیح می‌دهیم و در انتها توضیح می‌دهیم که روشهای ذکر شده با اینکه تا حدودی توانسته‌اند مشکل تعیین نرخ یادگیری را حل کنند ولی کافی نیستند و نیاز است که شرطهای دیگری نیز در تعیین نرخ یادگیری گنجانده شود.

برای درک بهتر مطالب ما در این جلسه نیز چندین مثال و پروژه عملی در متلب انجام داده‌ایم.

ویدئوی زیر بخش کوتاهی از جلسه‏‏‌ی پنجم است که برای آشنایی در اختیار شما قرار داده شده است. بخش کامل این جلسه، و همچنین پکیج کامل شبکه‌های عصبی (شامل تمام جلسات) را از لینک‌های زیر خریداری نمایید.

باتشکر

خرید جلسه‌ی پنجم

خرید کامل پکیج شبکه‌های عصبی

دوره های مرتبط

شبکه عصبی ELM (جلسه نهم)

در این جلسه تئوری یادگیری شبکه عصبی ELM را طبق مقاله به زبان ساده توضیح داده و سپس به صورت مرحله به مرحله در متلب پیاده‌سازی کرده‌ایم. و در انتها برای اینکه با کارایی این مدل آشنا شوید چندین پروژه عملی…

محمد نوری زاده چرلو

1398-04-28

شبکه عصبی RBF(جلسه هشتم)

در این جلسه شبکه عصبی توابع شعاعی پایه(radial basis function) را آموزش می‌دهیم. شبکه عصبی rbf یک شبکه عصبی 3 لایه است که از یک لایه پنهان تشکیل شده است. از قضیه جالب کاور برای حل مسائل پیچیده و غیرخطی…

محمد نوری زاده چرلو

1398-04-28

mlp با قانون یادگیری دلتا بار دلتا (جلسه هفتم)

برای اینکه نرخ یادگیری بهینه ای داشته باشیم لازم است که در جاهایی که شیب خطا در چند تکرار متوالی یکسان است نرخ یادگیری به صورت خطی و آهسته زیاد کنیم و از طرفی زمانی که علامت مشتق تابع هزینه…

محمد نوری زاده چرلو

1398-04-28

MLP با قانون یادگیری دلتا دلتا (جلسه ششم)

در ابتدای این جلسه شروط مورد نیاز جهت تعیین نرخ یادگیری بهینه را توضیح می‌دهیم . سپس تئوری الگوریتم یادگیری دلتا دلتا را توضیح داده و در نهایت در متلب به صورت گام به گام پیاده‌سازی می‌کنیم. و ایرادات اساسی…

محمد نوری زاده چرلو

1398-04-28

تعیین نرخ یادگیری پس انتشار خطا (جلسه پنجم)

در این جلسه چالش‌های تعیین نرخ یادگیری را توضیح می‌دهیم و در ادامه چند روش ساده از قبیل ترم ممنتوم، search then converge و time variant را برای تعیین نرخ یادگیری طبق مطالب کتاب ارائه می‌دهیم و در متلب پیاده‌سازی…

محمد نوری زاده چرلو

1398-04-28

شبکه عصبی پرسپترون چندلایه (جلسه چهارم)

در ‌این جلسه تئوری الگوریتم پس ‌انتشار خطا کامل توضیح داده می‌شود و در نهایت در متلب مرحله به مرحله پیاده‌سازی شده و چندین مثال ساده جهت درک بهتر روند یادگیری شبکه عصبی پرسپترون چندلایه انجام میدهیم و در نهایت…

محمد نوری زاده چرلو

1398-04-28

پیاده سازی شبکه عصبی پرسپترون تک لایه (جلسه دوم)

در این جلسه تئوری شبکه‌عصبی پرسپترون تک لایه را توضیح داده و سپس در متلب گام به گام پیاده‌سازی ‌می‌کنیم. این شبکه ساده‌ترین نوع شبکه عصبی است که برای کلاسبندی داده‌های خطی استفاده می‌شود. در این جلسه مثالهای مخلتفی انجام…

محمد نوری زاده چرلو

1398-04-28