Brian Heater 28ژوئیه 2023 -تصویر یک بازوی رباتیک در یک مرکز تولیدی.Getty Images
یکی از اولین چیزهایی که در دنیای رباتیک کشف می کنید، پیچیدگی کارهای ساده است. چیزهایی که برای انسان ساده به نظر می رسند دارای متغیرهای بالقوه بی نهایتی هستند که ما آنها را بدیهی می دانیم. ربات ها چنین وضعیتی ندارند.
دقیقاً به همین دلیل است که بیشتر صنعت بر روی وظایف تکرارپذیر در محیط های ساختاریافته متمرکز شده است. خوشبختانه، دنیای یادگیری رباتیک در سالهای اخیر شاهد پیشرفتهایی بوده است که بازی را تغییر میدهند و این صنعت در مسیر ایجاد و استقرار سیستمهای سازگارتر است.
سال گذشته، تیم روباتیک Google DeepMind، Robotics Transformer – RT-1 – را به نمایش گذاشت که سیستمهای Robot Everyday خود را برای انجام وظایفی مانند انتخاب، قرار دادن و باز کردن آموزش میداد. به گفته این تیم، این سیستم مبتنی بر پایگاه داده ای از 130000 نمایش بود که منجر به موفقیت 97 درصدی برای بیش از 700 کار شد.
اعتبار تصویر: Google DeepMind
ولیکن RT-2 رونمایی میشود. وینسنت ونهوک، دانشمند برجسته و رئیس رباتیک DeepMind، در یک پست وبلاگی میگوید این سیستم به رباتها اجازه میدهد تا مفاهیم آموختهشده در مجموعه دادههای نسبتاً کوچک را به طور مؤثر به سناریوهای مختلف منتقل کنند.
گوگل توضیح می دهد: RT-2 قابلیت های تعمیم بهبود یافته و درک معنایی و بصری را فراتر از داده های روباتیکی که در معرض آن قرار گرفته است نشان می دهد. “این شامل تفسیر دستورات جدید و پاسخ به دستورات کاربر با انجام استدلال ابتدایی، مانند استدلال در مورد دسته بندی اشیا یا توضیحات سطح بالا است.” این سیستم به طور موثر توانایی تعیین مواردی مانند بهترین ابزار برای یک کار جدید خاص را بر اساس اطلاعات زمینه ای موجود نشان می دهد.
Vanhoucke به سناریویی اشاره می کند که در آن از یک ربات خواسته می شود زباله ها را دور بریزد. در بسیاری از مدلها، کاربر باید به ربات آموزش دهد که چه چیزی را به عنوان زباله تشخیص دهد و سپس به آن آموزش دهد تا زبالهها را جمع کند و دور بریزد. این یک سطح از جزئیات است که به ویژه برای سیستم هایی که انتظار می رود مجموعه ای از وظایف مختلف را انجام دهند، مقیاس پذیر نیست.
Vanhoucke می نویسد: «از آنجایی که RT-2 قادر به انتقال دانش از مجموعه بزرگی از داده های وب است، در حال حاضر ایده ای از چیستی زباله دارد و می تواند آن را بدون آموزش صریح شناسایی کند. «حتی ایده ای درباره نحوه دور انداختن زباله ها دارد، حتی اگر هرگز برای انجام این کار آموزش ندیده باشد. و به ماهیت انتزاعی زباله فکر کنید – آن چیزی که یک کیسه چیپس یا پوست موز بود بعد از خوردن آنها تبدیل به زباله می شود RT-2 میتواند از دادههای آموزشی زبان بینایی خود آن را درک کند و کار را انجام دهد.
این تیم میگوید که میزان کارآمدی در اجرای وظایف جدید از 32% به 62% در پرش از RT-1 به RT-2 بهبود یافته است.