چگونه کشف اتفاقی Hubel و Wiesel پایه‌گذار بینایی ماشین و شبکه‌های عصبی کانولوشنی شد


در این پست داستان یکی از مهم‌ترین کشفیات تاریخ علوم اعصاب و بینایی ماشین را بررسی می‌کنیم. David Hubel و Torsten Wiesel در دههٔ ۱۹۶۰ با یک آزمایش ساده و اتفاقی نشان دادند که نورون‌های قشر بینایی چگونه به لبه‌ها، خطوط و الگوهای خاص واکنش نشان می‌دهند. این کشف مفهوم «میدان دید» یا همانreceptive field و پردازش سلسله‌ مراتبی اطلاعات بصری را معرفی کرد؛ مفاهیمی که بعدها الهام‌بخش طراحی شبکه‌های عصبی کانولوشنی (CNN) و مدل‌های مدرن بینایی ماشین شدند.
در این مقاله، ضمن مرور داستان این کشف و تأثیر آن بر تحول بینایی مصنوعی، ارتباط آن با معماری CNNها را توضیح می‌دهیم و نشان می‌دهیم چگونه این ایدهٔ بیولوژیکی پایه‌گذار پیشرفت‌های عظیم در یادگیری عمیق شده است

در دهه‌ی ۱۹۶۰، دو دانشمند جوان به نامهای David Hubel و Torsten Wiesel  در دانشگاه Johns Hopkins، همکاری‌ای را آغاز کردند که بعدها یکی از مهم‌ترین کشفیات علوم اعصاب و بینایی ماشین را رقم زد.

نکته‌ی جالب این بود که آنها تجهیزات بسیار ابتدایی داشتند:یک میکروالکترود، یک نمایشگر اسلایدی ساده و یک گربهی بیهوش.

کشف اتفاقی یک لبهٔ نور در آزمایشگاهی ساده در جان‌هاپکینز
به فهم عملکرد نورون‌های بینایی انجامید،
جایزهٔ نوبل گرفت،
و پایهٔ شبکه‌های کانولوشنی (CNN) شد.

اگر امروز مدل‌هایی مانند HMAX، LeNet، AlexNet، ResNet   یا  Vision Transformers وجود دارند، ریشهٔ اصلی آن‌ها به همان روزی برمی‌گردد که یک خط نور، به ‌طور کاملاً تصادفی، یک نورون را فعال کرد.


آشنایی هابل و ویزل و شکل گیری تیم پژوهشی

David Hubel و Torsten Wiesel هر دو پزشک بودند، اما خیلی زود متوجه شدند که علاقهٔ عمیق‌تری به علوم اعصاب پایه دارند تا کار بالینی.

به‌همین دلیل تصمیم گرفتند مسیر حرفه‌ای خود را از فضای درمانی جدا کرده و وارد دنیای پژوهش دربارهٔ مغز و سیستم بینایی شوند.

پس از آشنایی با یکدیگر، هر دو به دانشگاه Johns Hopkins  پیوستند و تحقیقات خود را در آزمایشگاه استیون کوفلر (Stephen Kuffler)، نوروفیزیولوژیست برجستهٔ آن زمان، آغاز کردند.

Hubel-Wiesel and Stephen Kuffler

ویزل بعدها در سخنرانی‌هایش اشاره می‌کند که:

»ما هیچ ایدهٔ مشخصی نداشتیم که مغز چگونه تصویر را پردازش می‌کند؛ فقط یک سؤال بزرگ داشتیم«.

فضای باز و حمایت‌گرانه‌ای که Kuffler ایجاد کرده بود—محیطی که تشویق به آزمون و خطا—این امکان را به هابل و ویزل داد که آزادانه فرضیه‌سازی کنند و روش‌های جدید را امتحان کنند.

این همان نقطه‌ای بود که اولین قدم‌های یک همکاری ۲۰ ساله برداشته شد و به یکی از مهم‌ترین کشفیات تاریخ علوم اعصاب انجامید.

How Hubel and Wiesel’s Nobel-Winning Discovery Transformed Machine Vision and Inspired Modern CNNs

اینجا هم خود استاد ویزل توضیحات کاملی از شروع تحقیقات علمی تا کشفیات رو ارائه میدهند.

https://www.youtube.com/watch?v=aqzWy-zALzY

آزمایش تاریخی: چگونه مغز تصویر را می‌بیند؟

هدف آنها این بود که بفهمند یک نورون منفرد در قشر بینایی اولیه (V1)  چطور به محرک‌های تصویری واکنش نشان می‌دهد.

میکروالکترود را در ناحیه V1 مغز قرار دادند و شروع کردند به نمایش الگوهای نور و تاریکی (همون محرکهای بصری).

سیگنال‌های نورونها به ‌صورت صداهای فایرینگ روی اسپیکر ضبط می‌شد؛ هر بار که نورون فعال می‌شد، یک “تق‌تق” واضح شنیده می‌شد. و به این طریق متوجه میشدند که نورونها به محرک خاصی واکنش نشان میدهند.

How Hubel and Wiesel’s Nobel-Winning Discovery Transformed Machine Vision and Inspired Modern CNNs

اما اولین آزمایش‌ها کاملاً شکست خوردند. آن‌ها تمام صفحه را روشن می‌کردند و هیچ نوری هیچ نورونی را تحریک نمی‌کرد.

 

کشف کاملاً تصادفی!

در یکی از جلسات، هنگام قرار دادن یک اسلاید کاغذی در پروژکتور، یک لبهٔ باریک روشن روی صفحه افتاد. ناگهان نورونها شروع کرد به فایر کردن!

در همان لحظه، آن‌ها فهمیدند:

  • نورون‌های V1 به کل صفحه حساس نیستند
  • بلکه فقط به لبه‌ها
  • آن هم در جهت خاص
  • و در موقعیت خاص

پاسخ می‌دهند.

 

سرنوشت مقاله Hubel and Wiesel و داستان نقاشی ون‌گوگ

اولین مجموعه نتایج آنها در سال 1962 در مجله Journal of Physiology منتشر شد و پایه‌گذار تعریف علمی «Receptive Field» شد: بخشی از میدان دید که تحریک آن باعث فعال‌سازی یک نورون می‌شود.

receptive-field-of-neurons

در سال 1968–1969 هنگامی که آنها مقاله‌ای درباره‌ی «حساسیت نورون‌ها به جهت لبه‌ها» ارسال کردند، یکی از داوران گفته بود:

«این نکته جدید نیست؛ هنرمندان قبلاً آن را فهمیده بودند!» و حتی یک Self-Portrait از ون‌گوگ فرستاده بود که خطوط جهت‌دار را برجسته نشان می‌داد.

بعدها ویزِل در اینباره چنین نظری میدهد:

«شاید هنرمندان بدون آنکه بدانند، عملکرد مغز را بهتر از ما درک کرده‌اند» و از پتانسیل همکاری دو گروه علمی و هنری صحبت کرده است که میتونه به دستاوردهای علمی بزرگی منجر شود.

How Hubel and Wiesel’s Nobel-Winning Discovery Transformed Machine Vision and Inspired Modern CNNs

اکتشاف انقلابی هابل و ویزل

  • هر نورون در V1 یک Receptive Field محدود دارد
  • نورون‌ها به لبه‌ها و جهت‌های خاص حساس‌اند
  • برخی نورون‌ها “Simple Cells” هستند (حساس به مکان + جهت)
  • برخی دیگر “Complex Cells” (حساس به جهت، مستقل از مکان)

hmax-and-hierarchical-processing

هابل و ویزل دقیقاً نشان دادند که:

و اینکه مغز ساختار سلسله‌ مراتبی در پردازش تصویر دارد:

How Hubel and Wiesel’s Nobel-Winning Discovery Transformed Machine Vision and Inspired Modern CNNs

این مبنای تمام مدل‌های مدرن بینایی ماشین شد.

اثر این کشف بر بینایی ماشین

کشف آنها الهام‌بخش نسل جدیدی از مدل‌های کامپیوتری شد، مثل HMAX, Lent-5, AlexNet و کلی معمارهای یادگیری امروزی ….

🔸 اوایل دهه 2000 (HMAX)

اولین مدل محاسباتی که مستقیماً از Simple/Complex cells الهام گرفت
ساختار آن:

S1 (Gabor/Convolutional filters )→ C1 (Pooling)→ S2 → C2

این مدل پایه بسیاری از مدل‌های بیولوژیکی بود.

hmax-and-hierarchical-processing

 

لینک مقاله خودمون جهت آشنایی با HMAX

https://www.researchgate.net/publication/336224524_An_enhanced_HMAX_model_in_combination_with_SIFT_algorithm_for_object_recognition

 

🔸 شبکه های کانولوشنالی| LeNet-5, AlexNet

کل پارادایم معماری شبکه‌های عصبی کانولوشنالی  (CNNs)مثل  LeNet-5 و همگی بر اساس اصول بیولوژیکی کشف شده توسط هابل و ویزل بنا شده اند.

  • پردازش سلسله مراتبی:

هابل و ویزل نشان دادند که قشر بینایی اطلاعات را به صورت سلسله مراتبی پردازش می‌کند، از ویژگی‌های ساده (لبه‌ها) شروع کرده و به بازنمایی‌های پیچیده‌تر می‌رسد.

شبکه های عصبی کانولوشنالی (CNNs) نیز از لایه‌های متعددی برای انجام همین کار استفاده می‌کنند، به طوری که لایه‌های اولیه ویژگی‌های اساسی را تشخیص می‌دهند و لایه‌های عمیق‌تر این ویژگی‌ها را در الگوهای پیچیده ترکیب می‌کنند.

  • Convolutional Layers:

مشابه سلول‌های ساده (S-cells) عمل می‌کنند و به لبه‌های دارای جهت‌گیری خاص در یک ناحیه کوچک و محلی (receptive field) پاسخ می‌دهند.

  • Pooling Layers:

مشابه سلولهای پیچیده (C-cells) عمل میکنند تا درجه‌ای از عدم حساسیت به موقعیت دقیق یک ویژگی در یک receptive field  بزرگتر ایجاد کنند. مانند لایه های max-pooling در AlexNet

سال 1998 (LeNet-5):

اولین CNN موفق، برای OCR: ایدهٔ “کانولوشن + پولینگ” مستقیماً از ایده هابل و ویزل الهام گرفته شده بود. (توسط Yann LeCunیکی از پدرخوانده های هوش مصنوعی)

convolutional-neural-networks-CNNs

سال 2012- AlexNet:

انقلاب در یادگیری عمیق زمانی که CNN به ‌طور رسمی وارد دنیای «بینایی ماشین مدرن» شد و با الهام از همان اصول V1 توانست دنیای AI را دگرگون کند. (توسط Alex Krizhevsky، شاگرد Jeoffrey Hinton، یکی دیگر از پدرخوانده های هوش مصنوعی)

alexnet

🤝 دوستی ۲۰ ساله و پایان یک عصر

هابل و ویزل بیش از ۲۰ سال در کنار هم کار کردند. در سال 1981، به پاس این کشف بزرگ، جایزهٔ نوبل فیزیولوژی/پزشکی را دریافت کردند.

David Hubel در سال 2013  (87 سالگی) درگذشت. Wiesel سال 2024 تولد 100 سالگی اش را جشن گرفت و همچنان دربارهٔ علوم اعصاب و آموزش علم صحبت می‌کند.

در یک سخنرانی‌ای ویزل در مورد کمبود امکانات اولیه صحبت میکنه یا حتی نداشتن ایده عملی برای شناخت بهتر مغز…

How Hubel and Wiesel’s Nobel-Winning Discovery Transformed Machine Vision and Inspired Modern CNNs

توصیه کردند که اگر ایده‌ی کلی در ذهن دارید، شروع کنید، حتی با امکانات کم، بعدها که کارتون پیشرفت کرد به اندازه کافی حمایت مالی سمتتون میاد که میتونید آزمایشگاه‌های مجهز برای خودتون درست کنید….



برگرفته از جلسه اول فصل سوم دوره یادگیری عمیق (CNNs )

دوره جامع و تخصصی یادگیری عمیق

  • ما در دوره یادگیری عمیق، ابتدا با مفاهیم بنیادی هر شبکه عصبی آشنا میشویم
  • بعدش میرم سراغ ریاضیات و اثبات روابط “یادگیری هر شبکه عصبی”
  • در ادامه، شبکه‌های عصبی رو کاملا دستی پیاده‌سازی میکنیم،
  • بعدش میریم سراغ ابزارهای آماده در PyTorch.

💡در آخر هم میریم سراغ پروژه های عملی😊

www.onlinebme.com


دیدگاه ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

code