نوآوری در مدیریت برای توسعه پایدار

Kolnegar Private Media (Management Innovation for Sustainable Development)

2 آذر 1403 3:19 ق.ظ

داده‌های «جعلی» به ربات‌ها کمک می‌کند اجسام در هم ریخته را سریع‌تر یاد بگیرند

29 ژوئن 2022 – توسط دانشگاه میشیگان

پیتر میترانو یک آزمایش دستکاری طناب را نشان می دهد. نرم افزاری که او و برنسون توسعه دادند می تواند مجموعه داده های آموزشی را برای چالش هایی مانند دستکاری طناب گسترش دهد و میزان موفقیت ربات را دو برابر کند. اعتبار: دن نیومن، میشیگان رباتیک

در گامی به سمت روبات‌هایی که می‌توانند مانند انسان‌ها یاد بگیرند، یک رویکرد جدید مجموعه داده‌های آموزشی را برای ربات‌هایی که با اجسام نرم مانند طناب و پارچه یا در محیط‌های بهم ریخته کار می‌کنند، گسترش می‌دهد.این فناوری که توسط محققان روباتیک دانشگاه میشیگان توسعه یافته است، می تواند زمان یادگیری مواد و محیط های جدید را به چند ساعت به جای یک یا دو هفته کاهش دهد.

در شبیه‌سازی‌ها، مجموعه داده‌های آموزشی توسعه‌یافته، میزان موفقیت یک ربات را که طناب را به دور یک بلوک موتور حلقه می‌کند، بیش از 40 درصد بهبود بخشید و موفقیت‌های یک ربات فیزیکی را برای یک کار مشابه تقریباً دو برابر کرد.

این کار از جمله کارهایی است که یک مکانیک ربات باید بتواند به راحتی انجام دهد. اما دیمیتری برنسون، دانشیار رباتیک U-M و نویسنده ارشد مقاله ای که امروز در Robotics: Science ارائه شده است، می گوید، استفاده از روش های امروزی، یادگیری نحوه دستکاری هر شیلنگ یا تسمه ناآشنا به حجم عظیمی از داده ها نیاز دارد که احتمالاً برای روزها یا هفته ها جمع آوری می شود.

در آن زمان، ربات با طنات بازی می کرد – آن را دراز می کرد، انتهای آن را به هم نزدیک می کرد، آن را دور موانع حلقه می کرد و غیره – تا زمانی که تمام راه های حرکت را بفهمد.

برنسون گفت: “اگر ربات قبل از نصب آن نیاز به بازی با طناب برای مدت طولانی داشته باشد، برای بسیاری از برنامه ها کار نمی کند.”

در واقع، مکانیک انسانی احتمالاً تحت تأثیر یک همکار روباتی قرار نخواهد گرفت که به چنین زمان نیاز دارد. بنابراین برنسون و پیتر میترانو، یک دانشجوی دکترا در رباتیک، یک الگوریتم بهینه‌سازی را تغییر دادند تا کامپیوتر را قادر می‌سازد تا برخی از تعمیم‌هایی را که ما انسان‌ها انجام می‌دهیم انجام دهد – پیش‌بینی می‌کند که چگونه دینامیک مشاهده شده در یک نمونه ممکن است در موارد دیگر تکرار شود.

در یک مثال، ربات سیلندرها را روی یک سطح شلوغ هل داد. در برخی موارد سیلندر به چیزی برخورد نمی کرد و در مواردی با سیلندرهای دیگر برخورد می کرد و آنها در پاسخ حرکت می کردند.

اگر استوانه به چیزی برخورد نمی کرد، این حرکت می توانست در هر جایی از میز که مسیر آن را به داخل استوانه های دیگر نمی برد، تکرار شود. این برای یک انسان شهودی است، اما یک ربات باید آن داده ها را دریافت کند. برنامه میترانو و برنسون به جای انجام آزمایش‌های وقت‌گیر، می‌تواند تغییراتی را در نتایج آزمایش اول ایجاد کند که به همان شیوه به ربات خدمت می‌کند.

آنها بر روی سه کیفیت برای داده های ساخته شده خود تمرکز کردند که باید مرتبط، متنوع و معتبر باشد. به عنوان مثال، اگر فقط نگران حرکت ربات استوانه‌های روی میز هستید، داده‌های روی زمین مرتبط نیستند. طرف دیگر آن این است که داده ها باید متنوع باشند – تمام قسمت های جدول، همه زوایا باید بررسی شوند.

میترانو گفت: “اگر تنوع داده ها را به حداکثر برسانید، به اندازه کافی مرتبط نیستند. اما اگر ارتباط را به حداکثر برسانید، تنوع کافی نخواهد داشت.” “هر دو مهم هستند.”

و در نهایت، داده ها باید معتبر باشند. به عنوان مثال، هر شبیه سازی که دارای دو سیلندر است که فضای یکسانی را اشغال می کنند نامعتبر است و باید نامعتبر شناخته شود تا ربات بداند که این اتفاق نخواهد افتاد.

برای شبیه‌سازی و آزمایش طناب، میترانو و برنسون مجموعه داده‌ها را با برون‌یابی موقعیت طناب به مکان‌های دیگر در یک نسخه مجازی از یک فضای فیزیکی، گسترش دادند – تا زمانی که طناب مانند نمونه اولیه رفتار کند. . ربات شبیه سازی شده تنها با استفاده از داده های آموزشی اولیه، طناب را در 48 درصد مواقع به دور بلوک موتور قلاب کرد. پس از آموزش بر روی مجموعه داده های تقویت شده، ربات در 70 درصد مواقع موفق شد.

آزمایشی که در حال کاوش یادگیری با یک ربات واقعی بود، نشان داد که توانایی ربات برای گسترش هر تلاش به این روش، تقریباً میزان موفقیت آن را در طول 30 تلاش، با 13 تلاش موفق به جای هفت تلاش، دو برابر می‌کند.

https://techxplore.com

آیا این نوشته برایتان مفید بود؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *