7 آوریل 2023توسط موسسه علم و فناوری -Skolkovoسمت چپ: انتقال دامنه بهینه و غیربهینه. راست: نمونه ای از انتقال دامنه با الگوریتم جدید. تصویر توسط محققین. اعتبار: موسسه علم و فناوری Skolkovo
محققان Skoltech و موسسه تحقیقاتی هوش مصنوعی (AIRI) الگوریتم جدیدی را برای انتقال بهینه داده بین دامنه ها با استفاده از شبکه های عصبی توسعه داده اند. برخلاف بسیاری از تکنیکهای مشابه، روش جدید به مجموعه دادههای آموزشی جفتی، مانند نمونههای ورودی-خروجی، نیاز ندارد و میتواند بر روی مجموعههای داده مستقل از حوزههای ورودی و خروجی آموزش داده شود. این الگوریتم نتایج قابل تفسیر تری نسبت به سایر رویکردهای موجود ایجاد می کند و بر یک پایه نظری محکم استوار است.
مدلهای یادگیری ماشینی مدرن که برای کاربردهایی مانند تشخیص چهره یا گفتار و تجزیه و تحلیل تصویر پزشکی طراحی شدهاند، به مجموعه دادههای آموزشی بزرگی نیاز دارند که به سختی به دست میآیند. به همین دلیل است که محققان و مهندسان باید دادههای مصنوعی مطابق با دادههای موجود در واقعیت ایجاد کنند. این کار تا حد زیادی توسط مدل های تولیدی تسهیل می شود که اخیراً از نظر کیفیت متن و تصویر پیشرفت چشمگیری داشته اند.
مدلهای مولد به ترکیب دادهها از دادههای دیگر کمک میکنند، به عبارت دیگر، یک دامنه را به دامنه دیگر منتقل میکنند. به عنوان مثال، یک شبکه عصبی می تواند یک تصویر دیجیتالی از طرحی که توسط یک انسان کشیده شده است ایجاد کند یا جزئیات دقیق را در یک تصویر ماهواره ای افزایش دهد. این کارها معمولاً به نمونههای آموزشی جفتی و مجموعههای تصویر ورودی-خروجی نیاز دارند که یک شبکه عصبی یاد میگیرد آنها را تعمیم دهد و به تصاویر ورودی جدید بسط دهد، که به مقابله با چندین تصویر یکسان با کیفیتهای مختلف، از جمله موارد دیگر کمک میکند.
از آنجایی که داده های جفت شده معمولاً بسیار گران یا سخت به دست می آیند، محققان باید به مجموعه داده های مستقل بسنده کنند که دستیابی به یک نتیجه خوب را دشوارتر می کند.
“رویکردهای استاندارد برای ساخت مدل های مولد برای انتقال دامنه تا حد زیادی اکتشافی هستند و وابسته به فراپارامترهای متعددی هستند که بر نتایج آموزش تاثیر می گذارند و به راحتی قابل انتخاب نیستند. علاوه بر این، چنین رویکردهایی فاقد یک چارچوب ریاضی دقیق هستند. در نتیجه، آموزش مدل یک فرآیند ناپایدار است که شما می توانید از آن استفاده کنید. پروفسور Evgeny Burnaev، مدیر هوش مصنوعی Skoltech و سرپرست تیم تحقیقاتی در AIRI، اظهار داشت: جای تعجب نیست که نتیجهگیریهای نظری دقیق در مورد نتایج آموزشی نیز سخت است.
این تیم در تحقیقات خود، آثار ریاضیدان و اقتصاددان شوروی، لئونید کانتوروویچ را مورد بازبینی قرار داد و از ایده های او در مورد حمل و نقل کالای بهینه (نظریه حمل و نقل بهینه) برای ایجاد الگوریتم جدیدی برای برنامه ریزی حمل و نقل بهینه داده بین دامنه ها استفاده کرد. الگوریتم جدید که Neural Optimal Transport نام دارد از شبکه های عصبی عمیق و مجموعه داده های مستقل استفاده می کند.
وقتی الگوریتم بر روی انتقال دامنه بدون جفت آزمایش میشود، در چندین کار، از جمله سبکدهی تصویر، از روشهای موجود بهتر عمل میکند. علاوه بر این، بر خلاف سایر تکنیک ها، به هایپرپارامترهای کمتری نیاز دارد، که معمولاً تنظیم آنها دشوار است، نتایج قابل تفسیرتری ایجاد می کند و بر پایه ریاضی محکمی استوار است.
روشهای عددی انتقال بهینه چندین سال است که به طور گسترده برای ساخت شبکههای عصبی مولد استفاده میشود. تحقیقات اکتشافی ما نشان داد که این مدلها انتقال بهینه را با خطای بسیار بالا محاسبه میکنند. ما نه تنها توانستهایم دلایل خطا را پیدا کنیم.
الکساندر کوروتین، دانشمند تحقیقاتی AIRI و سرپرست تیم تحقیقاتی Skoltech، گفت: انجام تجزیه و تحلیل و توسعه روشهای اساسی جدید موثر برای ساخت مدلهای مولد برای انتقال دامنه جفتنشده بر اساس تئوری انتقال بهینه هدف ما بوده است .
این تحقیق در سرور preprint arXiv منتشر شده است.