13 جولای 2023 – توسط کریستی دی اسمیت، دانشگاه هاروارد
پروفسور ساموئل گیرشمن و مامچیل توموف فوق دکترا از داوطلبانی خواستند در حالی که به اسکنرهای fMRI متصل هستند، بازی های ویدیویی به سبک آتاری انجام دهند. بر اساس نتایج، آنها دریافتند که جریان جهتدار اطلاعات در طول بازی از بالا به پایین است، برخلاف فرضیه اصلیشان. اعتبار: کریس اسنیبه/عکاس کارکنان هاروارد
چگونه مغز انسان شرایط پیچیده را هدایت می کند – مثلاً وقتی در ترافیک میدان هاروارد در ساعت 5 بعد از ظهر رانندگی می کند؟
یکی از نظریه هایی که مورد حمایت روانشناسان و عصب شناسان قرار می گیرد این است که مغز مدل های علی از جهان ایجاد می کند که به برنامه ریزی و اجرا کمک می کند. این شبیه شبیه سازی های ذهنی است تا ببینید کدام نتایج خوب یا بد هستند. مومچیل توموف، دانشیار روانشناسی، پروفسور ساموئل گیرشمن، آزمایشگاه علوم اعصاب شناختی محاسباتی، توضیح داد: «شما این مدل درونی محیط را یاد می گیرید، که می توانید از آن برای پیش بینی اینکه چه اتفاقی می افتد در صورت انجام اقدامات مختلف، استفاده کنید.
در دهه های اخیر، دانشمندان کامپیوتر این ایده ها را در سیستمی به نام یادگیری تقویتی یا به اختصار RL توسعه داده اند. محققانی مانند توموف که در تلاقی روانشناسی و فناوری کار میکنند، حتی مدلهای محاسباتی را معرفی کردهاند که تلاش میکنند نحوه عملکرد RL در مغز را به تصویر بکشند. در مقاله جدیدی که در Neuron منتشر شد، توموف و همکارانش از تشدید مغناطیسی تابعی (fMRI) برای مقایسه نظریه الگوریتمی خود در برابر تصویربرداری دنیای واقعی استفاده کردند.
چرا الگوریتم هایی ساخته می شود که سعی در رسمیت بخشیدن به تفکر و تصمیم گیری انسان دارند؟ توموف که دکترای خود را دریافت کرده است، در نوروبیولوژی در هاروارد در سال 2019 و تا سال 2021 با گیرشمن به عنوان پسادکتر کار کرد. می گوید: «مطالعه فرآیندهای شناختی بدون داشتن یک مدل محاسباتی دقیق که ورودی ها را به خروجی ها ترسیم می کند، دشوار است.
محققان همچنین امیدوارند که کار آنها منجر به پیشرفت در RL شود، که می تواند در محیط های پیچیده حرکت کند و یکی از بزرگترین داستان های موفقیت در هوش مصنوعی محسوب می شود. در واقع، انسان را در عرصههایی از جمله بازیهای تختهای و ویدیویی برتری داده است، اما تا همین اواخر ثابت شده بود که تا حدودی کند یاد میگیرد. توموف گفت: «الگوریتمهایی که بیشتر شبیه انسان هستند، میتوانند در حوزههای خاص بهتر از یادگیری ماشینی سنتی عمل کنند.
آزمایش این گروه بر کار قبلی دو نفر از نویسندگان همکار پژوهش تکیه دارد. توماس پونسی، یکی دیگر از محققین دکترا در آزمایشگاه گیرشمن، در سال 2021 سیستم RL پیچیده تر و مبتنی بر نظریه را ترسیم کرد. یک مدل RL مبتنی بر نظریه محاسباتی در مقاله بعدی توسط پدرو سیویدیس، محقق فوق دکتری MIT معرفی شد. در یادگیری بازی های ویدیویی جدید بسیار سریعتر از تکرارهای قبلی بود. توموف گفت از نظر سرعت، به توانایی انسان برای انجام چنین کاری بسیار نزدیکتر است.
کل این فرآیند باعث شد تا محققان در مورد معماری عصبی تصمیم گیری و یادگیری انسان فرضیه سازی کنند. در مطالعه جدید، محققان الگوریتم خود را بر روی 32 داوطلب آزمایش کردند که بازیهای ویدئویی به سبک آتاری را در حالی که به اسکنرهای fMRI متصل بودند، بازی میکردند و در نهایت به آنها مسلط بودند، که تغییرات کوچکی را در جریان خون ناشی از فعالیت مغز اندازهگیری میکردند.
همانطور که محققان انتظار داشتند، شواهدی از مدلهای مبتنی بر تئوری فعالیت در قشر جلوی مغز در جلوی مغز با بهروزرسانیهای تئوری در قشر خلفی یا پشت مغز به دست آمد. جایی که فرضیهها – و الگوریتم آنها – در جزئیات متفاوت بود.
محققان به طور خاص انتظار داشتند شواهدی از مدل های مبتنی بر نظریه در قشر اوربیتوفرونتال پیدا کنند. در عوض آنها آنها را در شکنج فرونتال تحتانی پیدا کردند. توموف گفت که این در گذشته منطقی است، زیرا تحقیقات قبلی در آزمایشگاه گیرشمن نشان داد که شکنج فرونتال تحتانی با یادگیری “قوانین علّی حاکم بر جهان” مرتبط است.
شگفتی های بیشتری در پشت مغز پیدا شد، جایی که قشر پس سری و مسیر شکمی – هر دو مرکزی برای پردازش بصری – به نظر می رسد زمانی که آن مدل ها نیاز به به روز رسانی دارند، درگیر هستند. توموف خلاصه میکند: «هرگاه اطلاعات شگفتانگیزی دریافت میکنید که با نظریه فعلیتان ناسازگار است، در آن زمان است که ما نه تنها یک سیگنال بهروزرسانی را در مسیر شکمی مشاهده میکنیم، بلکه در آن زمان است که این نظریه در شکنج فرونتال تحتانی فعال میشود».
در نهایت، اسکنهای fMRI جریان جهتدار اطلاعات را در مغز نشان داد. توموف و همکارانش این فرضیه را مطرح کرده بودند که اطلاعات از پایین به بالا جریان دارد. در عوض، به نظر می رسد که در طول بازی از بالا به پایین جریان دارد.
او میگوید: «تقریباً انگار از مدلی میآید که در جایی در قشر جلوی مغز ذخیره شده و به سمت قسمتهای بینایی خلفی جریان دارد.» “اما پس از آن زمانی که یک اختلاف وجود دارد – زمانی که یک به روز رسانی اتفاق می افتد – الگوی جریان اطلاعات تغییر می کند. اکنون اطلاعات از پایین به بالا، از مناطق عقبی به مناطق جلویی جریان می یابد.”
توموف چهار سال است که با گیرشمن RL مبتنی بر تئوری را مطالعه کرده است. دو سال پیش، او بهعنوان یک کارمند تمام وقت با سرمایهگذاری در بوستون، شروع به استفاده از این ایدهها در ماشینهای خودران کرد.
“چطور از اینجا به تقاطع بعدی میرسی و بدون برخورد به کسی به چپ می پیچی؟” . اساساً، این مدل داخلی جهان با سایر محرکها و پیشبینیهایی درباره کاری که قرار است انجام دهند وجود دارد.»