محققان ژاپنی در حال نشان دادن راهی برای رمزگشایی افکار هستند

مطالعه ای توسط محققان موسسه بین المللی تحقیقات ارتباطات پیشرفته (ATR) و دانشگاه کیوتو در ژاپن انجام شده است که یک شبکه عصبی ساخته اند که نه تنها آنچه را که در ذهن شماست می خواند، بلکه دوباره خلق می کند.

 

مقاله آنها، “بازسازی تصویر عمیق از فعالیت مغز انسان” در bioRxiv است. نویسندگان Guohua Shen ، Tomoyasu Horikawa، Kei Majima و Yukiyasu Kamitani هستند.

ونسا رامیرز، ویراستار Singularity Hub ، یکی از چندین نویسنده در سایت‌های تماشای فناوری بود که این مطالعه را گزارش کرد. نویسندگان خاطرنشان کردند که این تفاوت را با سایر تحقیقات مربوط به ساختارشکنی تصاویر بر اساس پیکسل ها و اشکال اساسی نشان می دهد.

Micu گفت: «تلاش برای رام کردن رایانه برای رمزگشایی تصاویر ذهنی ایده جدیدی نیست. با این حال، همه سیستم‌های قبلی از نظر دامنه و توانایی محدود بوده‌اند. برخی فقط می‌توانند حوزه‌های باریکی مانند شکل صورت را مدیریت کنند، در حالی که برخی دیگر فقط می‌توانند تصاویر را از تصاویر یا دسته‌های از پیش برنامه‌ریزی‌شده بازسازی کنند.

Micu گفت: آنچه در اینجا خاص است این است که “الگوریتم جدید آنها می تواند تصاویر جدید و قابل تشخیص را از ابتدا ایجاد کند.”

تیم مطالعه در حال بررسی بازسازی تصویر عمیق بوده است. Micu از نویسنده ارشد این مطالعه نقل قول کرد. یوکیاسو کامیتانی گفت: «ما معتقدیم که یک شبکه عصبی عمیق پروکسی خوبی برای پردازش سلسله مراتبی مغز است.

کامیتانی، یکی از دانشمندان، به CNBC Make It گفت: «ما در حال مطالعه روش‌هایی برای بازسازی یا بازسازی تصویری هستیم که یک فرد می‌بیند تنها با نگاه کردن به فعالیت مغزی فرد .

او گفت در جایی که رویکرد قبلی فرض بر این بود که یک تصویر از پیکسل ها یا اشکال ساده تشکیل شده است، “معلوم است که مغز ما اطلاعات بصری را به صورت سلسله مراتبی پردازش می کند و سطوح مختلف ویژگی ها یا اجزای پیچیدگی های مختلف را استخراج می کند.”

در مقاله خود نیز، نویسندگان روش شناسی را مورد بحث قرار دادند. آنها “یک روش جدید بازسازی تصویر” را توصیف کردند که در آن مقادیر پیکسل تصویر بهینه می شود تا ویژگی های DNN آن “شبیه به آنهایی که از فعالیت مغز انسان در چندین لایه رمزگشایی می شود” باشد. (به گفته Micu، توسط DNN، آنها به شبکه عصبی عمیق با “چند لایه از عناصر پردازش ساده” اشاره می کنند.

سه فرد سالم با دید طبیعی یا اصلاح شده به نرمال در این مطالعه شرکت کردند و تصاویر را در سه دسته مشاهده کردند. محرک های بصری شامل تصاویر طبیعی، اشکال هندسی مصنوعی و حروف الفبا بود.

مایک جیمز، من برنامه نویس ، گفت: “از همان ابتدا مهم است که متوجه شوید که این کار به داده های EEG ضربه نمی زند، یعنی تکانه های الکتریکی را از جمجمه نمی گیرد و آنچه را که فکر می کنید بررسی می کند.” جیمز گفت که این مطالعه از داده‌های یک اسکن MRI کاربردی استفاده می‌کند که فعالیت هر ناحیه از مغز را نشان می‌دهد. “به طور خاص فعالیت قشر بینایی به یک شبکه عصبی وارد می شود که سپس برای تولید خروجی آموزش داده می شود که با ورودی بصری که سوژه می بیند مطابقت داشته باشد.”

تصویربرداری رزونانس مغناطیسی عملکردی (fMRI) چیست ؟ Micu گفت این تکنیکی است که جریان خون را در مغز اندازه گیری می کند و از آن برای سنجش فعالیت عصبی استفاده می کند.

رامیرز نوشت که “فعالیت در قشر بینایی با استفاده از تصویربرداری تشدید مغناطیسی عملکردی (fMRI) اندازه گیری شد که به ویژگی های سلسله مراتبی یک شبکه عصبی عمیق ترجمه می شود .

Micu گفت: “این اسکن چندین بار انجام شد. در طول هر اسکن، از هر یک از سه سوژه خواسته شد تا بیش از 1000 تصویر را مشاهده کنند. این تصاویر شامل یک ماهی، یک هواپیما و اشکال رنگی ساده بود.”

جیمز برنامه نویس I : “شما بازتولید دقیق تصویر را دریافت نمی کنید، اما آنقدر نزدیک است که بتوان ارتباط را مشاهده کرد.”

Micu گفت: “این فناوری ما را یک قدم به سیستم هایی نزدیک تر می کند که می توانند آنچه را که در ذهن ما می گذرد بخوانند و درک کنند.”


اطلاعات بیشتر: Guohua Shen و همکاران. بازسازی تصویر عمیق از فعالیت مغز انسان، bioRxiv (2017). DOI: 10.1101/240317 

خلاصه
تجزیه و تحلیل مبتنی بر یادگیری ماشینی الگوهای تصویربرداری تشدید مغناطیسی عملکردی انسان (fMRI) تجسم محتوای ادراکی را ممکن کرده است. با این حال، به بازسازی با پایه های تصویر سطح پایین یا تطبیق با نمونه ها محدود شده است. کار اخیر نشان داد که فعالیت قشر بصری را می توان به ویژگی های سلسله مراتبی یک شبکه عصبی عمیق (DNN) برای همان تصویر ورودی رمزگشایی (ترجمه) کرد، و راهی برای استفاده از اطلاعات ویژگی های بصری سلسله مراتبی فراهم می کند. در اینجا، ما یک روش جدید بازسازی تصویر را ارائه می‌دهیم که در آن مقادیر پیکسل یک تصویر بهینه‌سازی می‌شوند تا ویژگی‌های DNN آن شبیه به آنهایی که از فعالیت مغز انسان در چندین لایه رمزگشایی شده‌اند، بسازند. ما دریافتیم که تصاویر تولید شده شبیه تصاویر محرک (هم تصاویر طبیعی و هم اشکال مصنوعی) و محتوای بصری ذهنی در طول تصویربرداری هستند. در حالی که مدل ما صرفاً با تصاویر طبیعی آموزش داده شده بود، روش ما با موفقیت بازسازی را به اشکال مصنوعی تعمیم داد، که نشان می‌دهد مدل ما واقعاً تصاویر را از فعالیت مغز بازسازی یا تولید می‌کند، نه اینکه صرفاً با نمونه‌ها مطابقت داشته باشد. یک تصویر طبیعی که قبلا توسط یک شبکه عصبی عمیق دیگر معرفی شده بود، با محدود کردن تصاویر بازسازی‌شده برای شبیه‌سازی تصاویر طبیعی، به طور موثر جزئیات معنادار معنایی را به بازسازی‌ها ارائه می‌کرد. علاوه بر این، قضاوت انسان در مورد بازسازی ها، اثربخشی ترکیب چندین لایه DNN را برای افزایش کیفیت بصری تصاویر تولید شده نشان می دهد.

شما هم مقاله بنویسید / برای اینکه نوسیده محتوای تخصصی و تجربیات خود باشید، لطفا کنید.

مقالات مرتبط

پاسخ‌ها