13 آوریل 2022 -توسط دیوید بردلی، Inderscience -اعتبار: Unsplash/CC0 دامنه عمومی
نیاز فوری برای رسیدگی به مشکل ظاهراً رو به رشد سرقت ادبی در دانشگاه وجود دارد. تیمی از عربستان سعودی که در مجله بینالمللی دادهکاوی، مدلسازی و مدیریت نوشته است، بر روی یک جنبه خاص از سرقت ادبی تمرکز کردهاند که در آن نویسنده از تصاویر دزدیده شده از منبع دیگری استفاده میکند و آنها را بدون اعتبار به خالق محتوای اصلی بهعنوان متعلق به خود منتشر میکند. چگونه این ممکن است با استفاده از فناوری تشخیص داده شود. تصاویر و ارقام در یک مقاله تحقیقاتی ممکن است نشان دهنده داده های تجربی سخت و یا حتی مفاهیم اصلی در تحقیق باشند و بنابراین برای تلاش علمی حیاتی هستند.
Taiseer Abdalla Elfadil Eisa از دانشگاه ملک خالد Mahail ، توضیح می دهد که تشخیص سرقت ادبی در ارقام و فرمولها و تصاویر مورد استفاده در یک نشریه تحقیقاتی بسیار چالش برانگیز است، نه حداقل به دلیل پیچیدگی تجزیه و تحلیل و مقایسه مورد نیاز، بلکه به دلیل تعداد بسیار زیاد مقالات پژوهشی منتشر شده در مجلات هر ساله. این تحقیق به تکنیکی میپردازد که میتواند محتوای متنی و ساختار شکلها را در یک مقاله تحلیل کند. وی توضیح می دهد که از پردازش تصویر و نگاشت معنایی استفاده می شود.
عیسی توضیح میدهد: «در نشریات علمی، اطلاعات کمی، نتایج آزمایشها، چارچوبها و حقایق آماری بهجای قالبهای متنی، بهصورت اینفوگرافیک مانند شکلها، نمودارها و جداول نشان داده میشوند. با این حال، کمتر به کشف سرقت ادبی در این عناصر غیر متنی انتشارات علمی توجه شده است.» مطالعه حاضر به طور مستقیم با غلبه بر محدودیت ابزارهای تطبیق متن فعلی برای استخراج اطلاعات برای مقایسه از اجزای غیر متنی یک تصویر، مانند نمودار جریان، به این موضوع می پردازد. این رویکرد میتواند اشکال درون یک تصویر را شناسایی کند، آنها و روابط آنها را در تصویر به صورت متنی توصیف کند و با OCR تشخیص کاراکتر نوری هر متنی در آن شکلها حاشیهنویسی کند.
Eisa می نویسد، این رویکرد به طور قابل توجهی در روش های موجود بهبود می یابد، و به مشکل متن در اشکال به شکلی می پردازد که روش های دیگر آن را مدیریت نکرده اند.