نوآوری در مدیریت برای توسعه پایدار

Kolnegar Private Media (Management Innovation for Sustainable Development)

5 آذر 1403 1:43 ب.ظ

استفاده از شبکه های عصبی برای انتقال داده بین دامنه ای بهینه

7 آوریل 2023توسط موسسه علم و فناوری -Skolkovoسمت چپ: انتقال دامنه بهینه و غیربهینه. راست: نمونه ای از انتقال دامنه با الگوریتم جدید. تصویر توسط محققین. اعتبار: موسسه علم و فناوری Skolkovo

محققان Skoltech و موسسه تحقیقاتی هوش مصنوعی (AIRI) الگوریتم جدیدی را برای انتقال بهینه داده بین دامنه ها با استفاده از شبکه های عصبی توسعه داده اند. برخلاف بسیاری از تکنیک‌های مشابه، روش جدید به مجموعه داده‌های آموزشی جفتی، مانند نمونه‌های ورودی-خروجی، نیاز ندارد و می‌تواند بر روی مجموعه‌های داده مستقل از حوزه‌های ورودی و خروجی آموزش داده شود. این الگوریتم نتایج قابل تفسیر تری نسبت به سایر رویکردهای موجود ایجاد می کند و بر یک پایه نظری محکم استوار است.

مدل‌های یادگیری ماشینی مدرن که برای کاربردهایی مانند تشخیص چهره یا گفتار و تجزیه و تحلیل تصویر پزشکی طراحی شده‌اند، به مجموعه داده‌های آموزشی بزرگی نیاز دارند که به سختی به دست می‌آیند. به همین دلیل است که محققان و مهندسان باید داده‌های مصنوعی مطابق با داده‌های موجود در واقعیت ایجاد کنند. این کار تا حد زیادی توسط مدل های تولیدی تسهیل می شود که اخیراً از نظر کیفیت متن و تصویر پیشرفت چشمگیری داشته اند.

مدل‌های مولد به ترکیب داده‌ها از داده‌های دیگر کمک می‌کنند، به عبارت دیگر، یک دامنه را به دامنه دیگر منتقل می‌کنند. به عنوان مثال، یک شبکه عصبی می تواند یک تصویر دیجیتالی از طرحی که توسط یک انسان کشیده شده است ایجاد کند یا جزئیات دقیق را در یک تصویر ماهواره ای افزایش دهد. این کارها معمولاً به نمونه‌های آموزشی جفتی و مجموعه‌های تصویر ورودی-خروجی نیاز دارند که یک شبکه عصبی یاد می‌گیرد آنها را تعمیم دهد و به تصاویر ورودی جدید بسط دهد، که به مقابله با چندین تصویر یکسان با کیفیت‌های مختلف، از جمله موارد دیگر کمک می‌کند.

از آنجایی که داده های جفت شده معمولاً بسیار گران یا سخت به دست می آیند، محققان باید به مجموعه داده های مستقل بسنده کنند که دستیابی به یک نتیجه خوب را دشوارتر می کند.

“رویکردهای استاندارد برای ساخت مدل های مولد برای انتقال دامنه تا حد زیادی اکتشافی هستند و وابسته به فراپارامترهای متعددی هستند که بر نتایج آموزش تاثیر می گذارند و به راحتی قابل انتخاب نیستند. علاوه بر این، چنین رویکردهایی فاقد یک چارچوب ریاضی دقیق هستند. در نتیجه، آموزش مدل یک فرآیند ناپایدار است که شما می توانید از آن استفاده کنید. پروفسور Evgeny Burnaev، مدیر هوش مصنوعی Skoltech و سرپرست تیم تحقیقاتی در AIRI، اظهار داشت: جای تعجب نیست که نتیجه‌گیری‌های نظری دقیق در مورد نتایج آموزشی نیز سخت است.

این تیم در تحقیقات خود، آثار ریاضیدان و اقتصاددان شوروی، لئونید کانتوروویچ را مورد بازبینی قرار داد و از ایده های او در مورد حمل و نقل کالای بهینه (نظریه حمل و نقل بهینه) برای ایجاد الگوریتم جدیدی برای برنامه ریزی حمل و نقل بهینه داده بین دامنه ها استفاده کرد. الگوریتم جدید که Neural Optimal Transport نام دارد از شبکه های عصبی عمیق و مجموعه داده های مستقل استفاده می کند.

وقتی الگوریتم بر روی انتقال دامنه بدون جفت آزمایش می‌شود، در چندین کار، از جمله سبک‌دهی تصویر، از روش‌های موجود بهتر عمل می‌کند. علاوه بر این، بر خلاف سایر تکنیک ها، به هایپرپارامترهای کمتری نیاز دارد، که معمولاً تنظیم آنها دشوار است، نتایج قابل تفسیرتری ایجاد می کند و بر پایه ریاضی محکمی استوار است.

روش‌های عددی انتقال بهینه چندین سال است که به طور گسترده برای ساخت شبکه‌های عصبی مولد استفاده می‌شود. تحقیقات اکتشافی ما نشان داد که این مدل‌ها انتقال بهینه را با خطای بسیار بالا محاسبه می‌کنند. ما نه تنها توانسته‌ایم دلایل خطا را پیدا کنیم.

 الکساندر کوروتین، دانشمند تحقیقاتی AIRI و سرپرست تیم تحقیقاتی Skoltech، گفت: انجام تجزیه و تحلیل و توسعه روش‌های اساسی جدید موثر برای ساخت مدل‌های مولد برای انتقال دامنه جفت‌نشده بر اساس تئوری انتقال بهینه هدف ما بوده است .

این تحقیق در سرور preprint arXiv منتشر شده است.

https://techxplore.com

آیا این نوشته برایتان مفید بود؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *