آلخاندرو بتانکور12 فوریه 2020
همانطور که تولیدکنندگان ادغام راه حل های هوش مصنوعی را در خطوط تولید آغاز می کنند ، کمبود داده به عنوان یک چالش اساسی ظاهر شده است. برخلاف شرکتهای اینترنتی مصرف کننده ، که از میلیونها کاربر برای آموزش مدلهای قدرتمند هوش مصنوعی اطلاعات دارند ، جمع آوری مجموعه ای از اطلاعات صنعت و در تولید اغلب غیرممکن است.
به عنوان مثال ، در ساخت خودرو ، جایی که روشهای ناب شش سیگما به طور گسترده ای پذیرفته شده است ، اکثر تولید کنندگان OEM و Tier One تلاش می کنند که در هر میلیون قطعه کمتر از سه تا چهار قطعه معیوب داشته باشند. نادر بودن این نقص ها داشتن داده های مرتبط کافی برای آموزش مدل های بازرسی بصری را به چالش می کشد.
در یک نظرسنجی اخیر MAPI ، 58٪ از پاسخ دهندگان به تحقیق گزارش کردند که مهمترین مانع در استفاده از راه حل های AI مربوط به کمبود منابع داده است.
فناوری هایی برای دور زدن مشکل داده های کوچک
داده های بزرگ ، هوش مصنوعی را در شرکت های اینترنتی کالاهای مصرف کننده را فعال کرده است. آیا تولید هم می تواند هوش مصنوعی را با داده های کوچک بکار بگیرد؟ در حقیقت ، پیشرفت های اخیر در هوش مصنوعی این امکان را فراهم می کند. تولیدکنندگان می توانند از تکنیک ها و فن آوری های زیر برای دور زدن مشکل کوچک بودن داده استفاده کنند تا به پروژه های هوش مصنوعی خود کمک کنند .
تولید داده های مصنوعی برای سنتز تصاویر بطور بدیعی استفاده می شود بگونه ای که جمع آوری آنها در زندگی واقعی دشوار است. برای انجام این کار می توان از پیشرفت های اخیر در تکنیک هایی مانند GAN ها ، خود رمزگذارهای متنوع ، تصادفی دامنه و افزایش داده ها استفاده کرد.
انتقال یادگیری تکنیکی است که هوش مصنوعی را قادر می سازد تا از یک کار مرتبط در جایی که داده های کافی در دسترس است یاد بگیرد و سپس از این دانش برای کمک به حل موضوع کار با داده های کم استفاده می کند. به عنوان مثال ، هوش مصنوعی می آموزد که از 1000 عکس فرورفتگی جمع آوری شده از انواع محصولات و منابع داده ، فرورفتگی را پیدا کند. سپس می تواند این دانش را برای شناسایی فرورفتگی در یک محصول جدید خاص فقط با چند عکس از فرورفتگی منتقل کند.
یادگیری خود نظارت شده: مشابه یادگیری انتقال است اما دانش به دست آمده با حل موضوع کمی متفاوت به دست می آید و سپس با مسئله داده های کوچک سازگار می شود. به عنوان مثال ، شما می توانید بسیاری از تصاویر خوب را بگیرید و یک شبکه پازل مانند ایجاد کنید تا براساس یک مدل پایه مرتب شود. حل این مسئله ساختگی مدل را مجبور به کسب دانش دامنه می کند که می تواند به عنوان نقطه شروع کار کوچک داده مورد استفاده قرار گیرد.
در یادگیری چند باره ، مشکل داده های کوچک برای کمک به سیستم هوش مصنوعی در هنگام دستیابی به همان هدف ، یک کار بازرسی آسان تر و کمتر مهم برای داده ها را دوباره فرموله می کند. در این سناریو ، هزاران وظیفه بازرسی آسان تر به هوش مصنوعی داده می شود ، جایی که هر کار فقط 10 نمونه (یا تعداد مشابه دیگر) دارد. این روش هوش مصنوعی را مجبور به یادگیری مهمترین الگوها می کند زیرا فقط یک مجموعه داده کوچک دارد. پس از آن ، هنگامی که این هوش مصنوعی را در معرض مشکلی قرار می گیرد که برای شما مهم است و فقط تعداد مشابهی از نمونه ها را دارد ، با دیدن هزاران کار مشابه داده کوچک ، در عملکرد خود ازآن سود خواهد برد.
در تشخیص ضایعات ، هوش مصنوعی نمونه با نقص صفر و فقط نمونه هایی از تصاویر سالم را می بیند. این الگوریتم می آموزد که هر چیزی را که به طور قابل توجهی از تصاویر سالم منحرف شود ، به عنوان یک مشکل بالقوه علامت گذاری کند.
دانش رمزگذاری دستی مثالی است که در آن یک تیم هوش مصنوعی با مهندسان بازرسی مصاحبه می کند و سعی می کند تا حد امکان دانش نهادی خود را در یک سیستم رمزگذاری کند. یادگیری ماشینی مدرن به سیستم هایی متکی است که به داده ها متکی هستند نه به دانش نهادی انسان ، اما در صورت عدم دسترسی به داده ها ، تیم های ماهر AI می توانند سیستم های یادگیری ماشینی را که از این دانش استفاده می کنند ، مهندسی کنند.
Human-in-the-loop شرایطی را توصیف می کند که از هر یک از تکنیک های ذکر شده در بالا می توان برای ساخت یک سیستم خطای اولیه ، شاید تا حدودی بالاتر استفاده کرد. اما هوش مصنوعی به اندازه کافی هوشمند است که می داند چه زمانی به شاخص اطمینان دارد یا خیر و می داند آن را به یک متخصص انسانی نشان دهد و در مورد دوم قضاوت خود را موکول کند. هر بار که این کار را انجام می دهد ، باید از انسان نیز یاد بگیرد ، به طوری که با گذشت زمان دقت و اطمینان را در خروجی خود افزایش می دهد.
با استفاده از ترکیبی از این رویکردها ، تولیدکنندگان می توانند مدل های بازرسی بصری موثر آموزش دیده در حدود 10 نمونه را ایجاد و بکار گیرند. ساختن سیستم های دارای داده های کوچک برای از بین بردن میلیون ها مورد استفاده مهم است که فقط مجموعه های داده کوچک در آن موجود است. برای تولیدکنندگان ، این زمان ، تلاش مهندسی و داده های مورد نیاز برای زنده ماندن و ایجاد ارزش عملی از هوش مصنوعی را به حداقل می رساند.