19 آوریل 2022 -توسط GIST موسسه علم و فناوری گوانگجو -مانند دید انسان، این روش امکان تشخیص اجسام مرئی، نیمه مسدود و نادیده را در یک چارچوب واحد فراهم می کند. اعتبار: موسسه علم و فناوری گوانگجو (GIST)
هنگامی که سیستمهای هوش مصنوعی با صحنههایی مواجه میشوند که در آن اشیاء به طور کامل قابل مشاهده نیستند، باید فقط بر اساس قسمتهای قابل مشاهده ، اشیاء را حدس بزنند. این اطلاعات جزئی منجر به خطاهای تشخیص می شود و داده های آموزشی زیادی برای تشخیص صحیح چنین صحنه هایی مورد نیاز است. اکنون، محققان موسسه علم و فناوری گوانگجو چارچوبی را ایجاد کرده اند که به دید روبات اجازه می دهد چنین اشیایی را به همان روشی که ما آنها را درک می کنیم، با موفقیت شناسایی کند.
بینایی رباتیک راه درازی را پیموده است و به سطحی از پیچیدگی با برنامههای کاربردی در کارهای پیچیده و سخت، مانند رانندگی مستقل و شناسایی اشیا رسیده است. با این حال، هنوز برای شناسایی اشیاء منفرد در صحنه های درهم و برهم که برخی از اشیا به طور جزئی یا کامل در پشت دیگران پنهان شده اند، تلاش می کند. به طور معمول، هنگام برخورد با چنین صحنههایی، سیستمهای بینایی روباتیک برای شناسایی جسم پنهان شده فقط بر اساس قسمتهای قابل مشاهده آن آموزش داده میشوند. اما چنین آموزشی به مجموعه داده های بزرگی از اشیا نیاز دارد و می تواند بسیار خسته کننده باشد.
دانشیار کیوبین لی و Ph.D. دانشجوی Seunghyeok Back از موسسه علم و فناوری گوانگجو (GIST) در کره زمانی که در حال توسعه یک سیستم هوش مصنوعی برای شناسایی و مرتبسازی اشیاء در صحنههای درهم بود، با این مشکل مواجه شد. ما از یک ربات انتظار داریم که اشیایی را که قبلاً با آنها برخورد نکردهاند یا برای تشخیص آموزش دیدهاند، شناسایی کند. با این حال، در واقعیت، باید دادهها را بهصورت دستی جمعآوری و برچسبگذاری کنیم، زیرا تعمیمپذیری شبکههای عصبی عمیق به شدت به کیفیت بستگی دارد.
در یک مطالعه جدید که در کنفرانس بینالمللی رباتیک و اتوماسیون IEEE در سال 2022 پذیرفته شد، یک تیم تحقیقاتی به رهبری پروفسور لی و آقای بک مدلی به نام «بخشبندی نمونه آمودال شی نادیده» (UOAIS) برای تشخیص اجسام پنهان شده در صحنههای بهم ریخته توسعه دادند. برای آموزش مدل در شناسایی هندسه اشیا، آنها پایگاه داده ای حاوی 45000 تصویر مصنوعی فوتورئالیستی حاوی اطلاعات عمق ایجاد کردند. با این داده های آموزشی (محدود)، مدل قادر به تشخیص انواع اشیاء ونهان شد. پس از مواجهه با یک صحنه درهم، ابتدا شی مورد نظر را انتخاب کرد و سپس با تقسیم کردن شی به یک “ماسک قابل مشاهده” و یک “ماسک آمودال” تعیین کرد که آیا شی پنهان شده است یا خیر.
محققان از نتایج هیجان زده شدند. “روش های قبلی به تشخیص فقط انواع خاصی از اشیاء یا تشخیص فقط مناطق قابل مشاهده بدون استدلال صریح بر روی مناطق مسدود محدود می شود. در مقابل، روش ما می تواند مناطق پنهان اشیاء مسدود شده را مانند سیستم بینایی انسان استنتاج کند. این امکان کاهش در تلاش برای جمع آوری داده ها در حالی که عملکرد را در یک محیط پیچیده بهبود می بخشد.”
برای فعال کردن “استدلال انسداد” در سیستم خود، محققان یک طرح “مدل سازی انسداد سلسله مراتبی” (HOM) را معرفی کردند که سلسله مراتبی را به ترکیب چندین ویژگی استخراج شده و ترتیب پیش بینی آنها اختصاص داد. آنها با آزمایش مدل خود در برابر سه معیار، اثربخشی طرح HOM را تأیید کردند که به عملکردی پیشرفته دست یافت.
محققان در مورد چشم انداز آینده روش خود امیدوار هستند. آقای بک می گوید: “درک اجسام نادیده در یک محیط به هم ریخته برای دستکاری رباتیک آمودال ضروری است. روش UOAIS ما می تواند به عنوان یک خط پایه در این جبهه عمل کند.”