13 فوریه 2024 -توسط دیوید بردلی، Inderscience-اعتبار: دامنه عمومی Pixabay/CC0
طعنه، یک پدیده پیچیده زبانی که اغلب در ارتباطات آنلاین یافت می شود، اغلب به عنوان وسیله ای برای بیان عقاید یا احساسات عمیق به شیوه ای خاص عمل می کند که می تواند به نوعی شوخ، منفعلانه-پرخاشگرانه، یا اغلب تحقیرکننده یا تمسخر آمیز باشد.برای شخص مورد خطاب ، تشخیص طعنه در کلام مکتوب برای درک هدف واقعی پشت آن یک نکته بسیار مهم است، به ویژه هنگامی که ما در حال بررسی رسانه های اجتماعی یا نظرات مشتریان آنلاین هستیم.
در حالی که تشخیص اینکه فردی در دنیای آفلاین به طعنه می پردازد معمولاً با توجه به حالت چهره، زبان بدن و سایر شاخص ها بسیار آسان است، رمزگشایی از کنایه در متن آنلاین دشوارتر است. کار جدید منتشر شده در مجله بینالمللی محاسبات بیسیم و سیار امیدوار است بتواند با این چالش مقابله کند. Geeta Abakash Sahu و Manoj Hudnurkar از دانشگاه بین المللی Symbiosis در پونا، هند، یک مدل پیشرفته تشخیص طعنه با هدف شناسایی دقیق اظهارات طعنه آمیز در مکالمات دیجیتالی ایجاد کرده اند، وظیفه ای که برای درک هدف واقعی پشت اظهارات آنلاین بسیار مهم است.
مدل تیم شامل چهار مرحله اصلی است. با پیش پردازش متن شروع می شود، که شامل فیلتر کردن کلمات رایج یا “نویز” مانند “the”، “it” و “and” است. سپس متن را به واحدهای کوچکتر تقسیم می کند. برای مقابله با چالش مواجهه با تعداد زیادی از ویژگیها، تیم از تکنیکهای انتخاب ویژگی بهینه برای اطمینان از کارایی مدل با اولویتبندی تنها مرتبطترین ویژگیها استفاده کرد. سپس ویژگیهایی که نشاندهنده طعنه هستند، مانند به دست آوردن اطلاعات، مجذور کای، اطلاعات متقابل و عدم قطعیت متقارن، از این دادههای از پیش پردازش شده توسط الگوریتم استخراج میشوند.
برای تشخیص طعنه، این تیم از طبقهبندیکننده مجموعهای شامل الگوریتمهای مختلفی از جمله شبکههای عصبی (NN)، روشهای تصادفی (RF)، ماشینهای بردار پشتیبانی (SVM) و یک شبکه عصبی پیچیده عمیق (DCNN) استفاده کرد. عملکرد دومی با استفاده از یک الگوریتم بهینهسازی جدید پیشنهادی به نام Clan Updated Grey Wolf Optimization (CU-GWO) بهینه شد.
این تیم دریافت که رویکرد آنها می تواند از روش های موجود در مقیاس های مختلف عملکرد بهتر عمل کند. به طور خاص، ویژگی را بهبود می بخشد، نرخ های منفی کاذب را کاهش می دهد و در مقایسه با رویکردهای استاندارد، مقادیر همبستگی برتری دارد.فراتر از پیامدهای فوری آن برای پردازش زبان طبیعی و تجزیه و تحلیل احساسات، این تحقیق نویدبخش بهبود الگوریتمهای تحلیل احساسات، ابزارهای نظارت بر رسانههای اجتماعی و سیستمهای خودکار خدمات مشتری است.