29 مارس 2024 -توسط DGISTموسسه علم و فناوری Daegu Gyeongbuk
مقایسه رویکردها در سطح مفهومی. (الف) مدل تشخیص ناهنجاری (AD) مستقیماً با استفاده از تصاویر آموزش داده می شود. (ب) روش پیشنهادی ما مدلهای تقسیمبندی بخش را با استفاده از چند نمونه برچسبدار برای قطعهبندی دقیق اجزاء هدایت میکند و سپس از قطعات برای AD استفاده میکند. (C) نمونههایی از ناهنجاریهای منطقی اهمیت بخشبندی معنایی اجزا را برای تشخیص نشان میدهند. اعتبار: arXiv (2023). DOI: 10.48550/arxiv.2312.13783
تیم تحقیقاتی پروفسور سانگ هیون پارک در دپارتمان مهندسی رباتیک و مکاترونیک در DGIST یک فناوری تشخیص ناهنجاری منطقی را با همکاری تیمی از دانشگاه استنفورد توسعه داده است. انتظار می رود این فناوری با استفاده از هوش مصنوعی برای شناسایی دقیق ناهنجاری های منطقی در تصاویر صنعتی، عملکرد تشخیص عیب را در کارخانه های هوشمند به طور قابل توجهی بهبود بخشد.
ناهنجاری های منطقی داده هایی هستند که محدودیت های منطقی اساسی، مانند تعداد، چینش یا ترکیب اجزای یک تصویر را نقض می کنند. برخلاف ناهنجاریهای ساختاری، که با بررسی تصاویر جزئی به راحتی قابل تشخیص هستند، تشخیص ناهنجاریهای منطقی به توانایی تمایز بین اجزای مختلف در کل تصویر نیاز دارد. مدلهای قبلی هوش مصنوعی نمرات AUROC ضعیفی را ثبت کردهاند که از میانگین 90 درصد در تشخیص ناهنجاری منطقی تجاوز نمیکند.
برای غلبه بر این محدودیت عملکرد، تیم تحقیقاتی پروفسور سانگ هیون پارک مدلی را پیشنهاد کرده است که ابتدا می آموزد هر جزء را به طور دقیق تقسیم کند و سپس از آن اطلاعات برای انجام تشخیص ناهنجاری استفاده می کند.
به طور معمول، آموزش یک مدل تقسیمبندی نیاز به برچسبگذاری در سطح پیکسل دارد، که مشکل کار مهمی را ایجاد میکند. برای پرداختن به این موضوع، تیم تحقیقاتی تکنیک تقسیم بندی چند شات را با استفاده از تعداد کمی از حقایق زمینی پیشنهاد کرده است.
تصاویری که برای آموزش مدل استفاده میشوند به یک شکل ترکیب شدهاند، یعنی هر تصویر متفاوت است، اما تعداد اجزا یا پیکسلها مشابه است. مدل تقسیمبندی به طور موثر با کمینه کردن تابع هدف با استفاده از هیستوگرام آموزش داده شد. در نتیجه، روش پیشنهادی دقت بالاتری را در مقایسه با تکنیکهای قطعهبندی چند شات موجود نشان داد.
علاوه بر این، این تحقیق مدلی را پیشنهاد میکند که از اطلاعات تقسیمبندی تصویر برای انجام تشخیص ناهنجاری منطقی و ساختاری به طور همزمان استفاده میکند. در مجموع از سه بانک حافظه برای محاسبه امتیازات تشخیص ناهنجاری از طریق مقایسه با تصاویر آزمایشی به طور موثر استفاده می کند.
تیم تحقیقاتی این فناوری را در مجموعه دادههای MVTec LOCO AD، که در میان چالشبرانگیزترین مجموعه دادههای تشخیص ناهنجاری منطقی موجود است، اعمال کردند. در حالی که تکنیک های موجود هر کدام عملکرد زیر میانگین 90% را در تشخیص ناهنجاری منطقی ثبت کرده اند، تکنیک پیشنهادی به میانگین عملکرد 98% دست یافت.
پروفسور سانگ هیون پارک از دپارتمان مهندسی رباتیک و مکاترونیک در DGIST گفت: “این تحقیق به طور چشمگیری عملکرد در تشخیص ناهنجاری منطقی را بهبود بخشیده است. این فناوری می تواند هزینه های مربوط به تشخیص عیب در کارخانه های هوشمند را به میزان قابل توجهی کاهش دهد.”
یافته ها در سرور preprint arXiv منتشر شده است.