17 اکتبر 2024-© shutterstock/Piotr Zajda
محققان دانشکده مهندسی و علوم کاربردی دانشگاه ویرجینیا یک تحلیلگر ویدیوی هوشمند مبتنی بر هوش مصنوعی را طراحی کردهاند که قادر به انجام فناوری تشخیص عمل بر روی انسان است.سیستم تشخیص کنش، به نام شبکه ترانسفورماتور مکانی-زمانی معنایی و حرکتی (SMAST)، نوید طیف وسیعی از مزایای اجتماعی را می دهد.این موارد شامل تقویت سیستم های نظارت و بهبود ایمنی عمومی، ردیابی پیشرفته حرکت در مراقبت های بهداشتی، و اصلاح نحوه حرکت وسایل نقلیه خودران در محیط های پیچیده است.
اسکات تی اکتون، پروفسور و رئیس دپارتمان مهندسی برق و کامپیوتر، که این پروژه را رهبری میکرد، گفت: «این فناوری هوش مصنوعی درهایی را برای تشخیص اقدامات بیدرنگ در برخی از سختترین محیطها باز میکند.
فناوری هوش مصنوعی برای تجزیه و تحلیل پیچیده ویدیو
این سیستم برای شناسایی و درک رفتارهای پیچیده انسانی بر دو جزء کلیدی متکی است.اولین مورد، یک مدل تشخیص کنش چند ویژگی است که به هوش مصنوعی کمک میکند تا روی مهمترین بخشهای صحنه – مانند یک شخص یا شی – تمرکز کند و در عین حال جزئیات غیرضروری را نادیده بگیرد. این باعث میشود که سیستم در تشخیص آنچه اتفاق میافتد دقیقتر شود، مانند تشخیص فردی که توپ را به جای حرکت دادن بازوی خود پرتاب میکند.دومین ویژگی کلیدی یک الگوریتم رمزگذاری موقعیتی دوبعدی آگاه از حرکت است که به هوش مصنوعی کمک می کند تا نحوه حرکت اشیا را در طول زمان ردیابی کند.
با ادغام این ویژگیها، SMAST میتواند اقدامات پیچیده را در زمان واقعی تشخیص دهد و در سناریوهای پرمخاطره مانند نظارت، تشخیص مراقبتهای بهداشتی یا رانندگی خودکار مؤثرتر باشد.
SMAST نحوه تشخیص و تفسیر اعمال انسان توسط ماشین ها را دوباره تعریف می کند. سیستمهای کنونی با فیلمهای ویدئویی آشفته، ویرایش نشده و پیوسته دست و پنجه نرم میکنند که اغلب زمینه رویدادها را از دست میدهند.طراحی نوآورانه SMAST به آن اجازه میدهد تا روابط پویا بین افراد و اشیاء را با دقت قابلتوجهی به تصویر بکشد که توسط مؤلفههای هوش مصنوعی امکان یادگیری و تطبیق با دادهها را فراهم میکند.
استانداردهای جدید در فناوری تشخیص اقدام
این جهش عظیم در فناوری تشخیص اقدام به این معنی است که سیستم هوش مصنوعی می تواند اقداماتی مانند عبور دونده از خیابان، انجام یک عمل دقیق پزشکی یا حتی تهدید امنیتی در فضای شلوغ را شناسایی کند.
SMAST قبلاً از راه حل های سطح بالا در معیارهای کلیدی دانشگاهی، از جمله AVA، UCF101-24 و EPIC-Kitchens بهتر عمل کرده است و استانداردهای جدیدی را برای دقت و کارایی تعیین می کند.
متیو کوربان، یکی از همکاران تحقیقاتی فوق دکتری در آزمایشگاه اکتون که روی این پروژه کار می کند، گفت: «تأثیر اجتماعی می تواند بسیار زیاد باشد.ما از دیدن اینکه چگونه این فناوری هوش مصنوعی ممکن است صنایع را متحول کند و سیستمهای مبتنی بر ویدئو را هوشمندتر و قادر به درک در زمان واقعی کند، هیجانزده هستیم.