نویسنده: پریسا ایلون
طی سالهای گذشته دانشمندان تکنیکهای مبتنی بر یادگیری ماشین مختلفی را برای تشخیص چهره طراحی کردهاند. این تکنیکها میتوانند کاربردهای جالبی داشته باشند، برای مثال، ارتقاء مانیتور نظارتی، کنترل امنیت و یا کاربرد در سیستم قضایی. علاوه بر تشخیص چهره، پیشرفت در یادگیری ماشین، در ایجاد ابزارهایی برای تخمین و پیشبینی فاکتورهای کیفیتی از جمله سن و یا جنسیت فرد با آنالیز چهره نیز موفق بوده است.
در یک مطالعه اخیر دانشمندان دانشگاه Kwazulu-Natal در آفریقا جنوبی مدلی مبتنی بر یادگیری ماشین برای تخمین سن افراد با بررسی تصاویر تهیه شده از چهره در موقعیتهای کنترل نشده ایجاد کردند. این مطالعه در مجله Spinger منتشر شد و در کنگره جهانی Computational Collective Intelligence (ICCCI) نیز ارائه شده است.
بیشتر رویکردهای قبلی تشخیص سن تنها زمانی خوب عمل میکردند که چهره را در یک محیط کنترل تهیه میکردند برای مثال در آزمایشگاه یا در استودیو عکاسی. از طرفی، تعداد کمی از اینها قادر بودند در تصاویر گرفته شده در زندگی واقعی افراد هم صادق باشند.
دانشمندان در مقاله خود نوشتند:
روشهای یادگیری عمیق ثابت کردهاند در حل این مشکل موفق هستند به خصوص زمانی که کلان دیتاها برای آموزش دادن سیستم محیا باشند. به همین دلیل ما از یادگیری عمیق برای حل این مساله استفاده کردیم.
آنها یک شبکه عصبی کانولوشنی طراحی کردند که دارای شش لایه بود. مدل آنها برای تخمین سن افراد با استفاده از چهرههای گرفته شده در محیط غیرکنترل آموزش داده شد. این شبکه برای این کار یاد میگیرد که کدام ویژگیهای چهره برای تخمین سن مهمتر هستند و روی آنها متمرکز میشود.
به منظور ارتقاء مدل شبکه عصبی، دانشمندان آن را با استفاده از یک مجموعه داده بزرگ به نام IMDB-WIKI پیش آموزش دادند. این مجموعه دارای بیش از نیم ملیون تصویر چهره گرفته شده از IMDB و ویکی پدیا میباشد و با سن هر فرد نشانه گذاری شده است. آموزش اولیه کمک میکند تا شبکه خود را با محتوای چهره مطابقت دهد.
پس از آن دانشمندان مدل خود را با استفاده از تصاویر گرفته شده از دو مجموعه داده دیگر به نامهای MORPH-II و OUI-Adience میزان کردند ، به این ترتیب به مدل یاد دادند ویژگیها و تفاوتها را برداشت کند. MORPH-II دارای تقریبا 70,000 چهره نشانهگذاری شده است و OUI-Adience دارای 26,580 تصویر چهره گرفته شده در محیط زندگی واقعی است.
وقتی آنها مدل را برای تصاویر محیط کنترل نشده ارزیابی کردند، مشاهده کردند این آموزش سخت منجر به عملکرد قابل ملاحضه ای شده است. نتایج بسیار خوب بوده و عملکردی بسیار بهتر از متودهای دیگر تخمین چهره مبتنی بر شبکه عصبی داشته.
آنها نوشتند:
آزمایشات ما در ارزیابی عملکرد روی نمونههای OUI-Adience، که در زمینه تهیه تصاویر چهره در وضعیتهای نامحدود و ایدهآل شناخته شده است، موثر بودن روش را برای تخمین سن نشان میدهد. این روش به نتایج بسیار خوبی دست یافت و افزایش دقت 8.6 درصدی نسبت به بهترین نتایج گزارش شده بر اساس دادههای OUI-Adience را نشان داده است.
درآینده، تخمین موثر سن توسط شبکه عصبی جدید ارائه شده میتواند در وضعیتهای متنوعتری از زندگی استفاده شود. این تیم پژوهشی تصمیم دارد حتی لایههای بیشتری را به مدل اضافه کند و به محض آماده شدن دادههای تصویر چهره جدید در محیط کنترل نشده مدل را آموزش دهد تا همچنان عملکرد سیستم بهبود یابد.
دیدگاه ها