14 ژوئن 2024 -توسط موسسه علم و فناوری اوکیناوا-چارچوب رفتار بیزی اعتبار: Nature Communications (2024). DOI:
هم موجودات زنده و هم ماشینهای مبتنی بر هوش مصنوعی باید در واکنش به موقعیتها سریع و سازگارانه عمل کنند. در روانشناسی و علوم اعصاب، رفتار را می توان به دو دسته تقسیم کرد: عادتی (سریع و ساده اما غیر قابل انعطاف) و هدفمند (انعطاف پذیر اما پیچیده و کندتر).
دانیل کانمن، برنده جایزه نوبل در علوم اقتصادی، بین اینها به عنوان سیستم 1 و سیستم 2 تمایز قائل می شود. با این حال، بحث در مورد اینکه آیا آنها نهادهای مستقل و متضاد هستند یا اجزای متقابل حمایت کننده هستند، وجود دارد.
دانشمندان مؤسسه علم و فناوری اوکیناوا (OIST) و مایکروسافت تحقیقات آسیایی در شانگهای روش جدیدی را برای هوش مصنوعی پیشنهاد کردهاند که در آن سیستمهای رفتارهای معمولی و هدفدار یاد میگیرند که به یکدیگر کمک کنند.
از طریق شبیهسازیهای رایانهای که کاوش یک هزارتو را تقلید میکردند، این روش به سرعت با محیطهای در حال تغییر سازگار میشود و همچنین رفتار انسانها و حیوانات را پس از اینکه برای مدت طولانی به یک محیط خاص عادت کرده بودند، بازتولید کرد.
این مطالعه که در Nature Communications منتشر شده است، نه تنها راه را برای توسعه سیستمهایی هموار میکند که به سرعت و با اطمینان در زمینه در حال رشد هوش مصنوعی تطبیق میدهند، بلکه سرنخهایی از نحوه تصمیمگیری ما در زمینههای علوم اعصاب و روانشناسی ارائه میدهد.
دانشمندان مدلی را استخراج کردند که سیستمهای معمولی و هدفمند را برای رفتار یادگیری در عوامل هوش مصنوعی که یادگیری تقویتی را انجام میدهند، یک روش یادگیری مبتنی بر پاداش و تنبیه، بر اساس تئوری «استنتاج فعال» که تمرکز آن بوده است، ادغام میکند. اخیراً بسیار مورد توجه قرار گرفته است.
در این مقاله، آنها یک شبیهسازی رایانهای با تقلید از یک کار ایجاد کردند که در آن موشها یک پیچ و خم را بر اساس نشانههای بصری کشف میکنند و وقتی به هدف میرسند با غذا پاداش میگیرند.آنها نحوه سازگاری و ادغام این دو سیستم را در حین تعامل با محیط بررسی کردند و نشان دادند که می توانند به سرعت به رفتار تطبیقی دست یابند. مشاهده شد که عامل هوش مصنوعی داده ها را جمع آوری کرده و رفتار خود را از طریق یادگیری تقویتی بهبود می بخشد.
چیزی که مغز ما ترجیح می دهد
پس از یک روز طولانی در محل کار، معمولاً بصورت خودکار (رفتار معمولی) به خانه می رویم. با این حال، اگر تازه خانهتان را عوض کردهاید و به آن توجه نمیکنید، ممکن است از روی عادت به مکان قدیمیتان برگردید.
وقتی متوجه میشوید که این کار را انجام میدهید، دندهها را تغییر میدهید (رفتار هدفمند) و مسیر را به خانه جدید خود تغییر میدهید. به طور سنتی، این دو رفتار به طور مستقل عمل می کنند، در نتیجه رفتار یا عادتی و سریع اما غیرقابل انعطاف، یا هدفمند و انعطاف پذیر اما کند است.
دانشجوی واحد تحقیقات نورروباتیک شناختی OIST و اولین نویسنده مقاله، توضیح داد.
“انتقال خودکار از رفتار هدفمند به رفتار عادتی در حین یادگیری یک یافته بسیار معروف در روانشناسی است. مدل و شبیه سازی های ما می توانند دلیل این اتفاق را توضیح دهند: مغز رفتار را با اطمینان بالاتر ترجیح می دهد. با پیشرفت یادگیری، رفتار عادتی کمتر تصادفی می شود.” بنابراین، مغز ترجیح می دهد پس از آموزش قابل توجه به رفتارهای معمولی تکیه کند.
برای هدف جدیدی که هوش مصنوعی برای آن آموزش ندیده است، از یک مدل داخلی محیط برای برنامه ریزی اقدامات خود استفاده می کند. نیازی به در نظر گرفتن همه اقدامات ممکن نیست، بلکه از ترکیبی از رفتارهای معمول خود استفاده می کند که باعث کارآمدتر شدن برنامه ریزی می شود.
این رویکردهای سنتی هوش مصنوعی را به چالش میکشد که برای دستیابی به آنها نیاز به گنجاندن تمام اهداف ممکن در آموزش دارد. در این مدل، هر هدف مورد نظر را می توان بدون آموزش صریح، اما با ترکیب انعطاف پذیر دانش آموخته شده، به دست آورد.
پروفسور جون تانی، رئیس واحد تحقیقات نورروباتیک شناختی، اظهار داشت: «دستیابی به نوعی تعادل یا معاوضه بین رفتار انعطاف پذیر و معمولی مهم است. راههای ممکن برای دستیابی به یک هدف میتواند وجود داشته باشد، اما در نظر گرفتن همه اقدامات ممکن بسیار پرهزینه است، بنابراین رفتار هدفدار با رفتارهای معمولی محدود میشود تا گزینهها را محدود کند.
دکتر هان زمانی که شروع به کار بر روی الگوریتم های هوش مصنوعی کرد، به علوم اعصاب و شکاف بین هوش مصنوعی و انسانی علاقه مند شد. “من شروع کردم به فکر کردن در مورد اینکه چگونه هوش مصنوعی می تواند مانند انسان ها کارآمدتر و سازگارتر رفتار کند. می خواستم اصول ریاضی اساسی را درک کنم و چگونه می توانیم از آنها برای بهبود هوش مصنوعی استفاده کنیم. این انگیزه تحقیقات دکترای من بود.”
درک تفاوت بین رفتارهای عادتدار و هدفدار پیامدهای مهمی دارد، بهویژه در زمینه علوم اعصاب، زیرا میتواند اختلالات عصبی مانند ADHD، OCD و بیماری پارکینسون را روشن کند.ما در حال بررسی اصول محاسباتی هستیم که توسط آن چندین سیستم در مغز با هم کار می کنند.
پروفسور کنجی دویا، رئیس واحد محاسبات عصبی توضیح داد که تعدیلکنندههای عصبی مانند دوپامین و سروتونین نقش مهمی در این فرآیند دارند.سیستمهای هوش مصنوعی که با الهام از مغز توسعه یافتهاند و توانایی حل مشکلات عملی را دارند میتوانند به عنوان ابزار ارزشمندی برای درک آنچه در مغز انسانها و حیوانات اتفاق میافتد عمل کنند.»
دکتر هان مایل است به ساخت هوش مصنوعی بهتری کمک کند که بتواند رفتار خود را برای دستیابی به اهداف پیچیده تطبیق دهد.
“ما بسیار علاقه مند به توسعه هوش مصنوعی هستیم که توانایی های نزدیک به انسان را در انجام کارهای روزمره داشته باشد، بنابراین می خواهیم به این شکاف بین انسان و هوش مصنوعی بپردازیم. مغز ما دو مکانیسم یادگیری دارد و ما باید درک بهتری داشته باشیم که چگونه آنها با هم کار می کنند تا به هدف خود برسیم. “