14 جولای 2021 توسط دانشگاه جنوب کالیفرنیااعتبار: دامنه عمومی CC0
گروهی از محققان در USC به هوش مصنوعی کمک میکنند تا موضوعات تخیلی را تصور کند، این تکنیک همچنین میتواند منجر به هوش مصنوعی بهتر، داروهای جدید و افزایش ایمنی رباتها شود.
برای ایجاد تخیل یک گربه نارنجی را تصور کنید. اکنون، همان گربه را تصور کنید، اما با پوست سیاه و سفید ذغال سنگی رنگ. اکنون، تصور کنید گربه در امتداد دیوار چین راه میرود. با انجام این کار، یک سری سریع فعال سازی سلولهای عصبی در مغز شما، با توجه به دانش قبلی شما در مورد جهان، تغییرات مختلفی را در تصویر ارائه شده ارائه میدهد.
به عبارت دیگر، به عنوان انسان، تصور یک شی با ویژگیهای مختلف آسان است. اما، علی رغم پیشرفت در شبکههای عصبی عمیق که در بعضی از کارها با عملکرد انسان مطابقت دارند یا از آن فراتر میروند، کامپیوترها هنوز با موضوع مهارت انسانی تخیل دست و پنجه نرم میکنند.
در حال حاضر، یک تیم تحقیقاتی USC متشکل از پروفسور لورنت اتی و دکترای علوم کامپیوتر. دانشجویان Yunhao Ge ، Sami Abu-El-H و Gan Xin، یک هوش مصنوعی ایجاد کرده است که با استفاده از قابلیتهای انسان مانند، شیئی را که قبلاً هرگز ندیده است، با ویژگیهای مختلف تصور میکند. این مقاله با عنوان «سنتز عکسبرداری صفر با یادگیری تحت نظارت گروهی» در 7 می در کنفرانس بین المللی نمایندگیهای یادگیری 2021 منتشر شد.
نویسنده اصلی تحقیق، گفت: «ما از تواناییهای تعمیم بصری انسان الهام گرفتهایم تا سعی کنیم تخیل انسان را در ماشین شبیه سازی کنیم.»
«انسانها میتوانند دانش آموخته شده خود را با ویژگیها – به عنوان مثال، شکل، موقعیت، رنگ – جدا کرده و سپس آنها را برای تصور یک شی جدید ترکیب کنند. مقاله ما سعی دارد با استفاده از شبکههای عصبی این فرآیند را شبیه سازی کند.»
مشکل تعمیم هوش مصنوعی
به عنوان مثال، بگویید میخواهید یک سیستم هوش مصنوعی ایجاد کنید که تصاویر ماشینها را تولید میکند. در حالت ایده آل، شما چند الگوریتم با یک ماشینی از الگوریتم ارائه میدهید و میتوانید انواع مختلفی از اتومبیلها را تولید کنید – از پورشه گرفته تا پونتیاک تا کامیونهای وانت – در هر رنگ، از چند زاویه.
این یکی از اهداف طولانی مدت هوش مصنوعی است: ایجاد مدل هایی که بتوانند برون یابی کنند. این بدان معنی است که، با ذکر چند مثال، این مدل باید بتواند قوانین اساسی را استخراج کرده و آنها را در طیف وسیعی از نمونههای بدیعی که قبلاً ندیده است، اعمال کند. اما ماشینها معمولاً بدون در نظر گرفتن ویژگیهای جسم، روی ویژگیهای نمونه، مثلاً پیکسلها آموزش میبینند.
علم تخیل
در این مطالعه جدید، محققان سعی در غلبه بر این محدودیت با استفاده از مفهومی به نام از هم گسیختگی دارند. از هم گسیختگی میتواند برای ایجاد جعل عمیق استفاده شود، به عنوان مثال، با از هم گسستن حرکات صورت و هویت انسان. وی گفت، با این کار، مردم میتوانند تصاویر و فیلمهای جدیدی را ترکیب کنند که هویت شخص اصلی را با شخص دیگری جایگزین میکند، اما حرکت اصلی را حفظ میکند.
به همین ترتیب، رویکرد جدید گروهی از تصاویر نمونه را میگیرد – و نه یک نمونه را همزمان با الگوریتمهای سنتی که انجام میدهد – و شباهت بین آنها را برای دستیابی به چیزی به نام «یادگیری نمایندگی جداشده قابل کنترل»، استخراج میکند.
سپس، این دانش را برای دستیابی به سنتز تصویری قابل کنترل یا آنچه ممکن است تصور کنید، ترکیب میکند. به عنوان مثال، فیلم Transformer را مثال بزنید، این میتواند به شکل اتومبیل Megatron، رنگ و ژست ماشین Bumblebee زرد و پس زمینه Times Square در نیویورک درآید. نتیجه یک Bumblebee خواهد بود اتومبیل Megatron رنگی که در میدان تایمز حرکت میکند، حتی اگر این نمونه در طول جلسه آموزش دیده نشده باشد.
این همان چیزی است که ما به عنوان انسان برون یابی می کنیم: وقتی انسان رنگی را از یک شی می بیند ، می توانیم با جایگزینی رنگ اصلی با رنگ جدید ، آن را به راحتی روی هر جسم دیگری اعمال کنیم. این گروه با استفاده از تکنیک خود مجموعه داده جدیدی شامل 1.56 میلیون تصویر ایجاد کردند که می تواند به تحقیقات آینده در این زمینه کمک کند.
درک دنیا
گرچه از هم گسیختگی ایده جدیدی نیست ، محققان می گویند چارچوب آنها می تواند تقریباً با هر نوع داده یا دانشی سازگار باشد. این فرصت را برای برنامه ها بیشتر می کند. به عنوان مثال ، جدا کردن نژاد و دانش مربوط به جنسیت برای ایجاد هوش مصنوعی منصفانه با حذف ویژگی های حساس از معادله به طور کلی.
در زمینه پزشکی ، این امر می تواند به پزشکان و زیست شناسان کمک کند تا داروهای مفیدتری را ارایه کنند و عملکرد دارو را از سایر خواص جدا کنند و سپس آنها را برای ترکیب داروی جدید ترکیب کنند. استفاده از ماشین آلات با تخیل همچنین می تواند به ایجاد هوش مصنوعی ایمن تر کمک کند ، به عنوان مثال ، به وسایل نقلیه مستقل اجازه می دهد سناریوهای خطرناکی را که قبلاً در طول آموزش دیده نشده اند تصور کنند و از آنها جلوگیری کنند.
اتی گفت: “یادگیری عمیق قبلاً در بسیاری از حوزه ها عملکرد و قول بی نظیری را نشان داده است ، اما اغلب این اتفاق از طریق تقلید کم عمق و بدون درک عمیقتر از خصوصیات جداگانه ای که هر شی را منحصر به فرد می کند ، اتفاق افتاده است.” “این رویکرد جدید از هم گسیختگی ، برای اولین بار واقعاً احساس جدیدی از تخیل را در سیستم های هوش مصنوعی به وجود می آورد و آنها را به انسان نزدیکتر می کند”