تبدیل سیگنال های مغزی به گفتار و بازیابی گفتار یک فرد فلج
در دانشگاه UC سانفرانسیسکو، محققان دستگاه “نوروپروتستیک گفتار” (speech neuroprosthesis) را تولید کردند که امکان ایجاد ارتباط با جملات را به فرد فلج می دهد. این دستگاه قادر است تا سیگنال های مغزی فرد فلج را به متن ترجمه کند.
Edward Chang، جراح مغز و اعصاب بیش از یک دهه بر توسعه فناوری کار کرده است تا افرادی که قادر به صحبت نیستند، بتوانند توانایی برقراری ارتباط را داشته باشند. دستاورد این جراح، با همکاری اولین شرکت کننده در یک مطالعه پژوهشی بالینی توسعه یافت.
این تحقیق که در مجله پزشکی New England ارائه شده است، اولین نمایش موفقیت آمیز رمزگشایی مستقیم کلمات از امواج مغزی فردی است که به دلیل فلج بودن، قادر به صحبت نیست.
مترجم: امیررضا جهانی
تبدیل فعالیت مغز به گفتار
در گذشته، زمینه ارتباطات نوروپروتستیک در بازگرداندن ارتباطات، از طریق روش های مبتنی بر هجی و تایپ یک به یک حروف در متن متمرکز بود. اما اکنون در این مطالعه محققان سیگنال های مغزی را برای کنترل عضلات سیستم صوتی فرد جهت بیان کلمات ترجمه می کنند.
این تیم با هدف ارائه راهی برای برقراری ارتباط طبیعی تر و همچنین به صورت ارگانیک به بیماران فلج فعالیت می کند. دکتر ادوارد چانگ خاطر نشان کردند که با عمل گفتار، به طور معمول برای برقراری ارتباط اطلاعات را با سرعت بسیار بالایی، حداکثر 150 یا 200 کلمه در دقیقه، انتقال می دهیم.
هر ساله هزاران نفر به دلیل سکته های مغزی، تصادفات یا بیماری های مختلف، از مشکلات گفتاری و از دست دادن توانایی گفتار رنج می برند. با استفاده از این روش، بیماران و خانواده های آنها می توانند روزی به طور کامل با یکدیگر ارتباط برقرار کنند.
محققان یک آرایه subdural، با چگالی بالا و چند الکترودی را در منطقه قشر حسی-حرکتی قرار دادند. این بخش از مغز، گفتار را در یک فرد مبتلا به آنارتریا یا عدم توانایی در بیان گفتار کنترل می کند.
این تیم تحقیقاتی پس از 48 جلسه، 22 ساعت فعالیت قشر مغز را ثبت کردند. در این حین شرکت کننده سعی داشت تا کلمات مفرد را از 50 کلمه بیان کند. در مرحله بعدی، تیم با استفاده از الگوریتم های یادگیری عمیق، مدل های محاسباتی را برای شناسایی و طبقه بندی کلمات بر اساس الگوهای فعالیت مغزی ثبت شده ایجاد کردند.
با کمک مدل های محاسباتی و زبان طبیعی، محققان با امکانات و احتمالات مربوط به کلمه بعدی ، برای رمزگشایی جملات کاملی که شرکت کننده در تلاش برای گفتن آن بود، دست یافتند. این تیم جهت ترجمه الگوهای فعالیت عصبی ثبت شده به کلمات خاص، از مدل های شبکه عصبی سفارشی استفاده کردند که این مدل ها از هوش مصنوعی استفاده می کنند.
یافته های این مطالعه
این تیم جملات مربوط به فعالیت قشری شرکت کننده را در زمان واقعی با سرعت متوسط 15.2 کلمه در دقیقه رمزگشایی کردند. آنها همچنین 98 درصد تلاش های شرکت کننده برای تولید کلمات و همچنین کلمات طبقه بندی شده را با دقت 47.1 درصد تشخیص دادند. همچنین سیستم طراحی شده توسط این تیم توانست کلمات را از فعالیت مغز با حداکثر 18 کلمه در دقیقه و 93 درصد دقت رمزگشایی کند.
محققان نتیجه گیری کردند: “در یک فرد مبتلا به آنارتریا و کوادری پارزی اسپاستیک ناشی از سکته مغزی، کلمات و جملات مستقیماً از فعالیت قشر مغز در حین تلاش برای بیان آن کلمات با استفاده از مدل های یادگیری عمیق و یک مدل زبان طبیعی رمزگشایی می شوند.”
به طور کلی، عملکرد رمزگشایی با جمع آوری مقادیر زیادی از داده های آموزشی در طول زمان و بدون کالیبراسیون مجدد روزانه، حفظ و یا بهبود یافت که نشان می دهد الکتروکورتیکوگرافی با چگالی بالا ممکن است برای کاربردهای نوروپروتستیک گفتار مستقیم طولانی مدت مناسب باشد.
به عنوان اولین مطالعه برای تسهیل ارتباط از این روش، این مطالعه می تواند به طور بالقوه در موقعیت های مکالمه مورد استفاده قرار گیرد. در حال حاضر، این تیم در حال تلاش برای افزایش واژگان است. برنامه های آینده شامل گسترش آزمایش مطالعه برای تعداد بیشتر شرکت کنندگان می باشد.
دیدگاه ها