31 ژانویه 2023 -توسط دانشگاه هلسینکی
تجسم ماتریس شباهت P مجموعه دادههای آزمایششده با استفاده از تابع Matlab، که در آن سطرها و ستونها با برچسبهای خوشه دستی مرتب میشوند. نقاط آبی 1 ها را در ماتریس و نقاط سفیدصفر ها را نشان می دهند. به دلیل وضوح محدود، شکلها یک زیرنمونه یکنواخت 10 درصد نقاط داده را نشان میدهند.
یک الگوریتم جدید هوش مصنوعی که توسط محققان مرکز فنلاند برای هوش مصنوعی ایجاد شده است، با هدف تجسم مجموعه دادهها تا حد امکان واضح است. این پروژه نشان داد که راه حلی که به طور مستقل توسط الگوریتم انتخاب شده است، اغلب بسیار نزدیک به راه حلی است که بیشتر مورد علاقه انسان است.
مغز انسان توانایی شگفت انگیزی برای مشاهده ویژگی ها حتی از مقادیر بسیار زیاد اطلاعات بصری دارد. این توانایی، به عنوان مثال، در مطالعه توده های بزرگ داده استفاده می شود که محتوای آنها باید به شکلی فشرده شود که برای هوش انسان قابل درک باشد. این مشکل کاهش ابعاد برای تجزیه و تحلیل بصری مرکزی است.
در مرکز فنلاند برای هوش مصنوعی (FCAI)، محققان وابسته به دانشگاه آلتو و دانشگاه هلسینکی عملکرد شناختهشدهترین روشهای تجزیه و تحلیل بصری را آزمایش کردند و دریافتند که هیچکدام زمانی که حجم دادهها به طور قابل توجهی افزایش مییابد، کار نمیکنند. برای مثال، روشهای t-SNE، LargeViz و UMAP دیگر قادر به تشخیص سیگنالهای بسیار قوی گروههای مشاهدهای در دادهها نبودند، زمانی که تعداد مشاهدات به صدها هزار نفر رسید.
این تحقیق در مجله Statistics and Computing منتشر شده است.
داده های بوزون هیگز الهام گرفته از ایجاد الگوریتم جدید است .به عنوان مثال مجموعه داده آزمایشات مربوط به کشف بوزون هیگز شامل بیش از 11 میلیون بردار ویژگی است.
جوکا کوراندر، پروفسور آمار و احتمالات از دانشگاه هلسینکی میگوید: «تجسمهای بهدستآمده از آنها شبیه درهمتنیدهای از نخ بودند و هیچ یک از ویژگیهای قابل توجه رفتار ذرات موجود در دادهها را آشکار نمیکردند».
این یافته انگیزه ای برای توسعه روشی جدید است که از شتاب گرافیکی مشابه روش های هوش مصنوعی مدرن برای محاسبات شبکه عصبی استفاده می کند.الگوریتم هوش مصنوعی طراحی شده توسط محققان با هدف تجسم است، به طوری که خوشه های داده و سایر ویژگی های ماکروسکوپی، که به راحتی توسط انسان قابل مشاهده و قابل درک هستند، تا حد امکان متمایز باشند.
در این پروژه، چندین داوطلب این تکنیک را آزمایش کردند. مشخص شد که راه حلی که به طور مستقل توسط الگوریتم انتخاب می شود، اغلب بسیار نزدیک به راه حلی است که معمولاً مورد علاقه انسان است. در این وضعیت، هوش انسانی به وضوح، طبق تصورات شخصی، بین خوشههای دادهای که از مشاهدات مشابه تشکیل شدهاند، تمایز قائل میشود. هنگام استفاده از این تکنیک برای داده های بوزون هیگز، مهمترین ویژگی های فیزیکی آنها به وضوح برجسته شد.
کوراندر می گوید: “این یک جهش کوانتومی واقعی در زمینه تجزیه و تحلیل بصری است. تکنیک ما علاوه بر اینکه چندین مرتبه سریعتر از روش های قبلی است، در ارتباط با کاربردهای چالش برانگیز بسیار قابل اعتمادتر است.”
تحت هدایت گروه کوراندر، یک رابط جداگانه نیز برای استفاده از این تکنیک تا حد امکان کارآمد در کاربردهای ژنومیک طراحی شد. به این ترتیب، کاربران حتی می توانند با آپلود فایل ها به طور مستقیم در مرورگر وب، مجموعه داده های خود را به صورت تعاملی تجزیه و تحلیل کنند. این مطالعه بیشتر با استفاده از مجموعه دادههای باکتریایی و SARS-CoV-2 جهانی نشان داد که چگونه میتوان از ابزار جدید برای بررسی سریع میلیونها ژنوم و شناسایی ویژگیهای مرتبط استفاده کرد.
این مطالعه با همکاری پروفسور سامی کاسکی، مدیر FCAI، و گروه Jukka Corander انجام شد. پروفسور ژیرونگ یانگ از دانشگاه علم و صنعت نروژ به عنوان سرپرست پروژه خدمت کرد. پروفسور یانگ دارای مدرک دکترا از دانشگاه آلتو است و متعاقباً به عنوان محقق در دانشگاه آلتو و دانشگاه هلسینکی در گروه پروفسور کوراندر کار کرده است.