12 آگوست 2020 توسط آزمایشگاه تحقیقات ارتش آمریکا
در آینده ، یک سرباز و یک کنترل کننده بازی ممکن است تمام آنچه را که برای آموزش روبات ها به منظور چگونگی پیشی گرفتن از انسان است نیازاست را به دستگاه آموزش دهد.
در آزمایشگاه تحقیقات و توسعه تواناییهای ارتش آمریكا و دانشگاه تگزاس در آستین ، محققان الگوریتمی را طراحی كردند كه به یک وسیله نقلیه زمینی خودمختار اجازه می دهد سیستمهای ناوبری موجود خود را با مشاهده یك محرک انسانی بهبود بخشد. این تیم رویکرد خود را به نام پارامتر برنامه ریز سازگار که از وضعیتها یا APPLD استفاده می کند ، روی یکی از وسایل نقلیه زمینی خودمختار آزمایشگاهی ارتش آزمایش کرد.
محقق ارتش ، دکتر گارت وارنل گفت: “با استفاده از رویکردهایی مانند APPLD ، سربازان فعلی در مراکز آموزشی موجود قادر خواهند بود به سادگی با کارکرد وسایل نقلیه خود به طور عادی به پیشرفت در سیستم های خودمختار کمک کنند.” “تکنیک هایی از این قبیل ، نقش مهمی در برنامه های ارتش برای طراحی و میدانی نسل بعدی وسایل نقلیه جنگی که برای حرکت مستقل در محیط های خارج از جاده مجهز می شوند ، خواهد داشت.”
محققان یادگیری ماشینی را با الگوریتم های نمایش و سیستم های ناوبری کلاسیک تلفیق کردند. APPLD به جای جایگزین کردن یک سیستم کلاسیک ، می آموزد که چگونه سیستم موجود را تنظیم کند تا بیشتر شبیه به رفتار انسانی کار کند. وارنل گفت این پارادایم به سیستم ایجاد شده اجازه می دهد تا تمام مزایای سیستم های ناوبری کلاسیک – از جمله بهینه سازی ، تبیین و ایمنی – را حفظ کند و در عین حال به سیستم اجازه انعطاف پذیری و سازگاری با محیط های جدید را می دهد.
وارنل گفت: “تفاوتهای رانندگی انسان ها، با استفاده از یک کنترلر بی سیم Xbox ، به APPLD اجازه می دهد تا نحوه تنظیم سیستم ناوبری خودمختار موجود خودرو را به طور متفاوتی بسته به محیط خاص محلی بیاموزد.” “به عنوان مثال ، هنگامی که در یک مسیر تنگ قرار دارید ، رانندگی انسانی کند شده و با دقت رانندگی می کند. پس از مشاهده این رفتار ، سیستم خودمختار یاد خواهد گرفت که می تواند حداکثر سرعت خود را کاهش داده و دقت محاسبات خود را در محیط های مشابه افزایش دهد ، این در نهایت به وسیله نقلیه یاد می دهد که چگونه موفق شود وبه صورت خودگردان در مسیرهای مشابه دیگر که قبلاً شکست خورده بود ، حرکت کند. “
این تحقیق بخشی از یک برنامه آزاد ارتش است که از طریق آن ، دانشمندان ارتشی در تگزاس با شرکای دانشگاهی در UT آستین همکاری می کنند.
دکتر پیتر استون ، استاد و رئیس کنسرسیوم روباتیک در UT آستین گفت APPLD ” نمونه دیگری از جریان فزاینده ای از نتایج تحقیق است که با همکاری بی نظیر بین UT آستین و آزمایشگاه تحقیقات ارتش تسهیل شده است.” “ما با استفاده کامل دکتر Warnell در بصورت تمام وقت ، می توانیم به سرعت مشکلات تحقیقاتی را که هم پیشرفت های علمی برجسته ای هستند و هم به ارتش مربوط می شوند ، شناسایی کرده و برطرف کنیم.”
آزمایشات این تیم نشان داد كه پس از آموزش ، سیستم APPLD توانست با سرعت بیشتری و با خرابی كمتر از سیستم كلاسیك ، محیطهای آزمایشی را هدایت كند. علاوه بر این ، سیستم APPLD آموزش دیده غالباً سریعتر از انسانی که آنرا آموزش داده است ، درمحیط عمل می کند.
استون گفت: “از دیدگاه یادگیری ماشینی ، APPLD با سیستم های به اصطلاح یادگیری که سعی در یادگیری کل سیستم ناوبری از ابتدا دارند به پایان می رسد. ” وی گفت: “این رویکردها به داده های زیادی نیاز دارند و ممکن است منجر به رفتارهایی شود که نه ایمن و نه قوی باشد. APPLD از قسمت هایی از سیستم کنترلی که به دقت مهندسی شده اند ، استفاده می کند ، ضمن اینکه یادگیری ماشینی خود را بر روی فرآیند تنظیم پارامتر متمرکز می کند که اغلب بر اساس شهود یک فرد انجام می شود. “
APPLD پارادایم جدیدی را نشان می دهد که در آن افراد بدون دانش سطح تخصصی در روباتیک می توانند به آموزش و بهبود ناوبری خودروهای مستقل در محیط های مختلف کمک کنند. به جای تیم های کوچکی از مهندسین که سعی در تنظیم های دستی سیستم های ناوبری در تعداد کمی از محیط های آزمایشی دارند ، تعداد نامحدودی از کاربران می توانند داده های مورد نیاز خود را برای تنظیمات به تعداد نامحدودی از محیط ها ارائه دهند.
دکتر جاناتان فینک ، محقق ارتش گفت: “سیستم های ناوبری فعلی مستقل باید به طور معمول برای دستیابی به هر محیط استقرار جدید دوباره تنظیم شوند.” وی گفت: “این روند بسیار دشوار است و باید توسط کسی که آموزش گسترده ای در زمینه رباتیک دارد انجام شود و تا زمان یافتن تنظیمات صحیح سیستم نیاز به آزمایش و خطا زیادی دارد. در مقابل ، APPLD با تماشای یک تصمیم انسانی ، سیستم را بطور خودکار تنظیم می کند. “
تمرکز ارتش بر مدرن سازی خودروهای رزمی نسل بعدی شامل طراحی خودروی جنگی با سرنشین اختیاری و وسایل نقلیه جنگی رباتیک است که می توانند به صورت مستقل در محیط های عملیاتی خارج از جاده حرکت کنند. در حالی که سربازان می توانند در محیط هایی که وسایل نقلیه فعلی جنگی را هدایت می کنند حرکت کنند .
برای ادامه این تحقیق ، تیم سیستم APPLD را در محیط های متنوعی در فضای باز آزمایش می کنند ، سربازان راننده را استخدام می کنند و با طیف گسترده تری از رویکردهای ناوبری خودمختار موجود آزمایش می کنند. علاوه بر این ، محققان تحقیق خواهند کرد که آیا اتصال اطلاعات حسگر اضافی مانند تصاویر دوربین می تواند منجر به یادگیری رفتارهای پیچیده تری از قبیل تنظیم سیستم ناوبری برای کار در شرایط مختلف ، مانند عملیات در زمین های مختلف یا با سایر اشیاء ، امکان پذیر شود.
https://techxplore.com