29 ژوئن 2022 – توسط دانشگاه میشیگان
پیتر میترانو یک آزمایش دستکاری طناب را نشان می دهد. نرم افزاری که او و برنسون توسعه دادند می تواند مجموعه داده های آموزشی را برای چالش هایی مانند دستکاری طناب گسترش دهد و میزان موفقیت ربات را دو برابر کند. اعتبار: دن نیومن، میشیگان رباتیک
در گامی به سمت روباتهایی که میتوانند مانند انسانها یاد بگیرند، یک رویکرد جدید مجموعه دادههای آموزشی را برای رباتهایی که با اجسام نرم مانند طناب و پارچه یا در محیطهای بهم ریخته کار میکنند، گسترش میدهد.این فناوری که توسط محققان روباتیک دانشگاه میشیگان توسعه یافته است، می تواند زمان یادگیری مواد و محیط های جدید را به چند ساعت به جای یک یا دو هفته کاهش دهد.
در شبیهسازیها، مجموعه دادههای آموزشی توسعهیافته، میزان موفقیت یک ربات را که طناب را به دور یک بلوک موتور حلقه میکند، بیش از 40 درصد بهبود بخشید و موفقیتهای یک ربات فیزیکی را برای یک کار مشابه تقریباً دو برابر کرد.
این کار از جمله کارهایی است که یک مکانیک ربات باید بتواند به راحتی انجام دهد. اما دیمیتری برنسون، دانشیار رباتیک U-M و نویسنده ارشد مقاله ای که امروز در Robotics: Science ارائه شده است، می گوید، استفاده از روش های امروزی، یادگیری نحوه دستکاری هر شیلنگ یا تسمه ناآشنا به حجم عظیمی از داده ها نیاز دارد که احتمالاً برای روزها یا هفته ها جمع آوری می شود.
در آن زمان، ربات با طنات بازی می کرد – آن را دراز می کرد، انتهای آن را به هم نزدیک می کرد، آن را دور موانع حلقه می کرد و غیره – تا زمانی که تمام راه های حرکت را بفهمد.
برنسون گفت: “اگر ربات قبل از نصب آن نیاز به بازی با طناب برای مدت طولانی داشته باشد، برای بسیاری از برنامه ها کار نمی کند.”
در واقع، مکانیک انسانی احتمالاً تحت تأثیر یک همکار روباتی قرار نخواهد گرفت که به چنین زمان نیاز دارد. بنابراین برنسون و پیتر میترانو، یک دانشجوی دکترا در رباتیک، یک الگوریتم بهینهسازی را تغییر دادند تا کامپیوتر را قادر میسازد تا برخی از تعمیمهایی را که ما انسانها انجام میدهیم انجام دهد – پیشبینی میکند که چگونه دینامیک مشاهده شده در یک نمونه ممکن است در موارد دیگر تکرار شود.
در یک مثال، ربات سیلندرها را روی یک سطح شلوغ هل داد. در برخی موارد سیلندر به چیزی برخورد نمی کرد و در مواردی با سیلندرهای دیگر برخورد می کرد و آنها در پاسخ حرکت می کردند.
اگر استوانه به چیزی برخورد نمی کرد، این حرکت می توانست در هر جایی از میز که مسیر آن را به داخل استوانه های دیگر نمی برد، تکرار شود. این برای یک انسان شهودی است، اما یک ربات باید آن داده ها را دریافت کند. برنامه میترانو و برنسون به جای انجام آزمایشهای وقتگیر، میتواند تغییراتی را در نتایج آزمایش اول ایجاد کند که به همان شیوه به ربات خدمت میکند.
آنها بر روی سه کیفیت برای داده های ساخته شده خود تمرکز کردند که باید مرتبط، متنوع و معتبر باشد. به عنوان مثال، اگر فقط نگران حرکت ربات استوانههای روی میز هستید، دادههای روی زمین مرتبط نیستند. طرف دیگر آن این است که داده ها باید متنوع باشند – تمام قسمت های جدول، همه زوایا باید بررسی شوند.
میترانو گفت: “اگر تنوع داده ها را به حداکثر برسانید، به اندازه کافی مرتبط نیستند. اما اگر ارتباط را به حداکثر برسانید، تنوع کافی نخواهد داشت.” “هر دو مهم هستند.”
و در نهایت، داده ها باید معتبر باشند. به عنوان مثال، هر شبیه سازی که دارای دو سیلندر است که فضای یکسانی را اشغال می کنند نامعتبر است و باید نامعتبر شناخته شود تا ربات بداند که این اتفاق نخواهد افتاد.
برای شبیهسازی و آزمایش طناب، میترانو و برنسون مجموعه دادهها را با برونیابی موقعیت طناب به مکانهای دیگر در یک نسخه مجازی از یک فضای فیزیکی، گسترش دادند – تا زمانی که طناب مانند نمونه اولیه رفتار کند. . ربات شبیه سازی شده تنها با استفاده از داده های آموزشی اولیه، طناب را در 48 درصد مواقع به دور بلوک موتور قلاب کرد. پس از آموزش بر روی مجموعه داده های تقویت شده، ربات در 70 درصد مواقع موفق شد.
آزمایشی که در حال کاوش یادگیری با یک ربات واقعی بود، نشان داد که توانایی ربات برای گسترش هر تلاش به این روش، تقریباً میزان موفقیت آن را در طول 30 تلاش، با 13 تلاش موفق به جای هفت تلاش، دو برابر میکند.