تخمین سن افراد با استفاده از شبکه عصبی کانولوشن


نویسنده: پریسا ایلون

طی سال‌های گذشته دانشمندان تکنیک‌های مبتنی بر یادگیری ماشین مختلفی را برای تشخیص چهره طراحی کرده‌اند. این تکنیک‌ها می‌توانند کاربردهای جالبی داشته باشند، برای مثال، ارتقاء مانیتور نظارتی، کنترل امنیت و یا کاربرد در سیستم قضایی. علاوه بر تشخیص چهره، پیشرفت در یادگیری ماشین، در ایجاد ابزارهایی برای تخمین و پیش‌بینی فاکتورهای کیفیتی از جمله سن و یا جنسیت فرد با آنالیز چهره نیز موفق بوده است.

در یک مطالعه اخیر دانشمندان دانشگاه Kwazulu-Natal در آفریقا جنوبی مدلی مبتنی بر یادگیری ماشین برای تخمین سن افراد با بررسی تصاویر تهیه شده از چهره در موقعیت‌های کنترل نشده ایجاد کردند. این مطالعه در مجله Spinger منتشر شد و در کنگره جهانی Computational Collective Intelligence (ICCCI) نیز ارائه شده است.

بیشتر رویکردهای قبلی تشخیص سن تنها زمانی خوب عمل می‌کردند که چهره را در یک محیط کنترل تهیه می‌کردند برای مثال در آزمایشگاه یا در استودیو عکاسی. از طرفی، تعداد کمی از این‌ها قادر بودند در تصاویر گرفته شده در زندگی واقعی افراد هم صادق باشند.

دانشمندان در مقاله خود نوشتند:

روش‌های یادگیری عمیق ثابت کرده‌اند در حل این مشکل موفق هستند به خصوص زمانی که کلان دیتاها برای آموزش دادن سیستم محیا باشند. به همین دلیل ما از یادگیری عمیق برای حل این مساله استفاده کردیم.

آن‌ها یک شبکه عصبی کانولوشنی طراحی کردند که دارای شش لایه بود. مدل آن‌ها برای تخمین سن افراد با استفاده از چهره‌های گرفته شده در محیط غیرکنترل آموزش داده شد. این شبکه برای این کار یاد می‌گیرد که کدام ویژگی‌های چهره برای تخمین سن مهم‌تر هستند و روی آن‌ها متمرکز می‌شود.

تخمین سن افراد با شبکه عصبی

تصاویر استفاده شده جهت آموزش شبکه عصبی کانولوشن برای تخمین سن افراد از روی چهره

به منظور ارتقاء مدل شبکه عصبی، دانشمندان آن را با استفاده از یک مجموعه داده بزرگ به نام IMDB-WIKI پیش آموزش دادند. این مجموعه دارای بیش از نیم ملیون تصویر چهره گرفته شده از IMDB و ویکی پدیا می‌باشد و با سن هر فرد نشانه گذاری شده است. آموزش اولیه کمک می‌کند تا شبکه خود را با محتوای چهره مطابقت دهد.

پس از آن دانشمندان مدل خود را با استفاده از تصاویر گرفته شده از دو مجموعه داده دیگر به نام‌های MORPH-II و OUI-Adience میزان کردند ، به این ترتیب به مدل یاد دادند ویژگی‌ها و تفاوت‌ها را برداشت کند.  MORPH-II دارای تقریبا 70,000 چهره نشانه‌گذاری شده است و OUI-Adience دارای 26,580 تصویر چهره گرفته شده در محیط زندگی واقعی است.

وقتی آن‌ها مدل را برای تصاویر محیط کنترل نشده ارزیابی کردند، مشاهده کردند این آموزش سخت منجر به عملکرد قابل ملاحضه ای شده است. نتایج بسیار خوب بوده و  عملکردی بسیار بهتر از متودهای دیگر تخمین چهره مبتنی بر شبکه عصبی داشته.

آن‌ها نوشتند:

آزمایشات ما در ارزیابی عملکرد روی نمونه‌های OUI-Adience، که در زمینه تهیه تصاویر چهره در وضعیت‌های نامحدود و ایده‌آل شناخته شده است، موثر بودن روش را برای تخمین سن نشان می‌دهد. این روش به نتایج بسیار خوبی دست یافت و افزایش دقت 8.6 درصدی نسبت به بهترین نتایج گزارش شده بر اساس داده‌های  OUI-Adience را نشان داده است.

درآینده، تخمین موثر سن توسط شبکه عصبی جدید ارائه شده می‌تواند در وضعیت‌های متنوع‌تری از زندگی استفاده شود. این تیم پژوهشی تصمیم دارد حتی لایه‌های بیشتری را به مدل اضافه کند و به محض آماده شدن داده‌های تصویر چهره جدید در محیط کنترل نشده مدل را آموزش دهد تا همچنان عملکرد سیستم بهبود یابد.

منبع


دیدگاه ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

code