یادگیری عمیق و مدل سازی کنترل و پیش بینی برای کوادروتورها و روبات های چابک

13 مارس 2023 – توسط Ingrid Fadelli- می‌توان از MPC عصبی بلادرنگ برای مدل‌سازی مؤثر اثرات زمینی بسیار پیچیده آئرودینامیکی که در پرواز نزدیک به موانع (جدول) رخ می‌دهند، استفاده کرد، تنها با استفاده از محاسبات درونی. اعتبار: سالزمن و همکاران

در سال‌های اخیر، دانشمندان کامپیوتر الگوریتم‌های پیشرفته‌تری را برای کنترل حرکات عوامل روباتیک توسعه داده‌اند. اینها شامل تکنیک‌های کنترل پیش‌بینی مدل (MPC) می‌شوند که از مدلی از پویایی عامل برای بهینه‌سازی رفتار آینده آن نسبت به یک هدف معین استفاده می‌کنند و در عین حال تعدادی از محدودیت‌ها را برآورده می‌کنند (مثلاً نمی‌توانند با موانع برخورد کنند).

محققان دانشگاه فنی مونیخ و دانشگاه زوریخ اخیراً Real-time Neural MPC را ایجاد کرده‌اند، چارچوبی که معماری‌های مدل پیچیده مبتنی بر شبکه‌های عصبی مصنوعی (ANN) را در چارچوب MPC برای روبات‌های چابک (یعنی کوادروتورها – پهپادها با چهار روتور) ادغام می‌کند. . این مفهوم که در IEEE Robotics and Automation Letters ارائه شده است، بر اساس رویکرد قبلی توسعه یافته توسط گروه رباتیک و ادراک دانشگاه زوریخ است.

تیم سالزمن و مارکوس رایل محققان گروه سیستم های هوایی خودمختار دانشگاه فنی مونیخ گفتند : «ما با کار عالی گروه روباتیک و ادراک به رهبری دیوید اسکاراموزا مواجه شدیم و بلافاصله شیفته ایده اصلی آن‌ها مبنی بر داشتن مؤلفه‌های مبتنی بر داده (یادگرفته‌شده) برای تقویت الگوریتم‌های کنترل «سنتی» شدیم.

پس از اینکه یک اثبات مفهوم برای تعمیم رویکرد آنها، که از فرآیندهای گاوسی (GPs) استفاده می‌کند، به شبکه‌های عصبی عمومی (مدل‌های یادگیری عمیق) ساختیم، ایده خود را به گروه رباتیک و ادراک در دانشگاه زوریخ ارائه کردیم. از آنجا به بعد، کار فنی و آزمایشات به طور مشترک بین دو آزمایشگاه پیش رفت و جرقه همکاری جدیدی را آغاز کرد.”

چارچوب جدید پیشنهاد شده توسط سالزمن، رایل و همکارانشان، مدل‌های یادگیری عمیق و بهینه‌سازی آنلاین MPC را ترکیب می‌کند. مدل‌های یادگیری عمیق بیانگر از نظر محاسباتی سنگین هستند. با این حال، با تقریب آن‌ها به صورت آنلاین در زمان واقعی، چارچوب می‌تواند از سخت‌افزار اختصاصی (GPU) برای پردازش کارآمد این مدل‌ها استفاده کند و به سیستم آنها اجازه دهد تا اقدامات بهینه را برای روبات‌ها در زمان واقعی پیش‌بینی کند.

Salzmann و Ryll توضیح دادند: «چارچوب Real-time Neural MPC امکان ترکیب دو زمینه، کنترل بهینه و یادگیری عمیق را فراهم می‌کند و در عین حال به هر دو بخش اجازه می‌دهد تا از چارچوب‌ها و دستگاه‌های محاسباتی بسیار بهینه‌شده خود استفاده کنند». “به این ترتیب، ما می‌توانیم محاسبات یادگیری عمیق را در PyTorch/Tensorflow روی یک GPU انجام دهیم، در حالی که بهینه‌سازی کنترل در کد C کامپایل شده روی یک CPU انجام می‌شود. این امکان استفاده از قدرت یادگیری عمیق را در برنامه‌هایی که قبلاً غیرقابل دستیابی بود، به عنوان مثال یک کوادروتور در کنترل بهینه آنبرد می‌کند.

محققان چارچوب خود را در یک سری آزمایش، هم در یک محیط شبیه سازی شده و هم در دنیای واقعی ارزیابی می کنند. در این آزمایش‌ها، آنها به طور خاص از آن برای کنترل اعمال یک کوادروتور بسیار چابک در زمان واقعی استفاده می‌کنند.

نتایج آنها بسیار امیدوارکننده است، زیرا می توانند از قدرت پیش بینی معماری شبکه های عصبی با ظرفیت پارامتری بیش از 4000 برابر بزرگتر از آنچه قبلاً برای کنترل حرکات ربات های چابک در زمان واقعی استفاده می شد، استفاده کنند. آنها همچنین دریافتند که در مقایسه با روش‌های MPC معمولی بدون مولفه یادگیری عمیق، چارچوب آنها می‌تواند خطاهای ردیابی موقعیتی را تا ۸۲ درصد کاهش دهد.

سالزمن و رایل می‌گویند: «در رباتیک، ما به دنبال مدل‌های گویا از دینامیک سیستم‌های کنترل‌شده و تعامل آن‌ها با محیط هستیم (به عنوان مثال، اثرات آیرودینامیکی، اصطکاک لاستیک‌ها و غیره). در حالی که فرمول‌بندی تحلیلی این‌ها اغلب دشوار است، رویکردهای مبتنی بر یادگیری، به‌ویژه شبکه‌های عصبی، می‌توانند پویایی و اثرات متقابل را ثبت کنند. با این حال، دقت مدل با اندازه شبکه عصبی مقیاس می‌شود. MPC عصبی در زمان واقعی استفاده از عمق را امکان‌پذیر می‌کند. مدل‌های یادگیری در مقایسه با آنچه قبلاً در کنترل پیش‌بینی مدل امکان‌پذیر بود، بسیار قوی‌تر و کارآمدتر است.”

همانطور که توسط پلتفرم Nvidia Jetson اخیراً منتشر شده نشان داده شده است، تراشه های GPU به تدریج راه خود را به سیستم های تعبیه شده پیدا می کنند. چارچوب ایجاد شده توسط این تیم از محققان به زودی به توسعه دهندگان این امکان را می دهد تا از قدرت پیش بینی بالای تکنیک های هوش مصنوعی مبتنی بر داده های پیشرفته برای مدل سازی بهتر پویایی ربات هایی که تراشه های GPU و تعامل آنها با محیط را ادغام می کنند، استفاده کنند و خطر تصادفات را کاهش داده و آنها قابلیت های ناوبری را بهبود بخشند.

سالزمن و رایل افزودند: «مسیرهای باز زیادی برای تحقیقات آینده وجود دارد. یکی از مشکلات رویکردهای یادگیری عمیق این است که خروجی آنها می‌تواند برای موقعیت‌هایی که بخشی از داده‌های آموزشی نیستند نامنظم باشد (Out Of Distribution OOD)

https://techxplore.com