اثر پیکان زمان در پیش بینی های هوش مصنوعی

16 سپتامبر 2024 – توسط نیک پاپاژورجیو، دانشکده پلی تکنیک فدرال لوزان

منحنی‌های تلفات اعتبارسنجی برای مدل‌های FW و BW در طول آموزش به طور مداوم، تلفات BW بیشتر از همتای FW خود است. این از طریق شروع مجدد گرم نرخ یادگیری ادامه می یابد، که باعث از دست دادن ضربه می شود. اعتبار: arXiv (2024). DOI: 10.48550/arxiv.2401.17505

محققان دریافته‌اند که مدل‌های زبان بزرگ هوش مصنوعی، مانند GPT-4، در پیش‌بینی چیزهای بعدی بهتر از آنچه در یک جمله آمده است، هستند. این اثر «پیکان زمان» می‌تواند درک ما از ساختار زبان طبیعی و نحوه درک این مدل‌ها از آن را تغییر دهد.

مدل های زبان بزرگ (LLM) مانند GPT-4 برای کارهایی مانند تولید متن، کدنویسی، عملیات چت بات ها، ترجمه و موارد دیگر ضروری شده اند. در قلب آنها، LLM ها با پیش بینی کلمه بعدی در یک جمله بر اساس کلمات قبلی کار می کنند – یک ایده ساده اما قدرتمند که بسیاری از عملکرد آنها را هدایت می کند.

اما چه اتفاقی می‌افتد وقتی از این مدل‌ها می‌خواهیم عقب‌نشینی را پیش‌بینی کنند – «در زمان به عقب بروند» و کلمه قبلی را از مدل‌های بعدی تعیین کنند؟

این سوال باعث شد که پروفسور کلمان هونگلر در EPFL و ژرمی ونگر از گلداسمیتز (لندن) به بررسی این موضوع بپردازند که آیا LLM ها می توانند داستانی را به عقب بسازند و از آخر شروع کنند. آنها با همکاری با واسیلیس پاپادوپولوس، محقق یادگیری ماشین در EPFL، چیز شگفت‌انگیزی را کشف کردند: LLMها به طور مداوم هنگام پیش‌بینی عقب‌نشینی نسبت به جلو، دقت کمتری دارند.

محققان LLM ها را با معماری ها و اندازه های مختلف، از جمله ترانسفورماتورهای از پیش آموزش دیده (GPT)، واحدهای بازگشتی دردار (GRU) و شبکه های عصبی حافظه کوتاه مدت (LSTM) آزمایش کردند. هر یک از آنها سوگیری “پیکان زمان” را نشان دادند و عدم تقارن اساسی را در نحوه پردازش متن LLM آشکار کرد.

هونگلر توضیح می دهد: “این کشف نشان می دهد که اگرچه LLM ها هم در پیش بینی کلمه بعدی و هم در پیش بینی کلمه قبلی در یک متن بسیار خوب هستند، اما همیشه کمی بدتر از جلو هستند: عملکرد آنها در پیش بینی کلمه قبلی همیشه چند درصد بدتر است. این پدیده در بین زبان ها جهانی است و با هر مدل زبانی بزرگ قابل مشاهده است.

این کار همچنین با کار کلود شانون، پدر نظریه اطلاعات، در مقاله مهم خود در سال 1951 مرتبط است. شانون بررسی کرد که آیا پیش‌بینی حرف بعدی در یک دنباله به آسانی پیش‌بینی حرف قبلی است یا خیر. او کشف کرد که اگرچه هر دو کار از نظر تئوری باید به یک اندازه دشوار باشند، اما پیش‌بینی عقب‌نشینی برای انسان‌ها چالش‌برانگیزتر بود – اگرچه تفاوت عملکرد حداقل بود.

هونگلر می‌گوید: «در تئوری، نباید تفاوتی بین جهت‌های رو به جلو و عقب وجود داشته باشد، اما به نظر می‌رسد LLM‌ها به نوعی به جهت زمانی که متن را در آن پردازش می‌کنند، حساس هستند. جالب اینجاست که این به ویژگی عمیق ساختار زبان مربوط می شود که تنها با ظهور مدل های زبانی بزرگ در پنج سال گذشته کشف شد.

محققان این ویژگی را به حضور عوامل هوشمند پردازش اطلاعات مرتبط می‌دانند، به این معنی که می‌توان از آن به عنوان ابزاری برای تشخیص هوش یا زندگی استفاده کرد و به طراحی LLM‌های قدرتمندتر کمک کرد. در نهایت، می تواند مسیرهای جدیدی را برای تلاش طولانی مدت برای درک گذر زمان به عنوان یک پدیده نوظهور در فیزیک نشان دهد.

کار بر روی سرور preprint arXiv منتشر شده است.

این مطالعه به خودی خود پیشینه جالبی دارد که هونگلر به آن اشاره می کند. در سال 2020، با ژرمی [ونگر]، با مدرسه تئاتر The Manufacture همکاری می‌کردیم تا یک ربات چت بسازیم که در کنار بازیگران برای انجام کارهای بداهه بازی کند؛ در بداهه، اغلب می‌خواهید داستان را ادامه دهید، در حالی که می‌دانید پایان باید چگونه باشد.

برای ساختن داستان‌هایی که به شیوه‌ای خاص به پایان می‌رسند، ما این ایده را به ذهنمان رساندیم که چت بات را آموزش دهیم تا «به عقب» صحبت کند، به آن اجازه می‌دهیم با توجه به پایانش داستانی تولید کند – به عنوان مثال، اگر پایان این باشد که «آنها تا به حال با خوشحالی زندگی کرده‌اند». ,’ مدل می تواند به شما بگوید که چگونه اتفاق افتاده است، بنابراین، ما به مدل ها آموزش دادیم تا این کار را انجام دهند و متوجه شدیم که کمی عقب تر از جلو هستند.

«با واسیلیس [پاپادوپولوس] بعداً متوجه شدیم که این یک ویژگی عمیق زبان است و این یک پدیده کاملاً جدید است که پیوندهای عمیقی با گذشت زمان، هوش و مفهوم علیت دارد..”

هیجان هونگلر از این اثر تا حد زیادی ناشی از غافلگیری غیرمنتظره ای است که در این راه پیش آمد. فقط زمان می تواند بگوید که کاری که به عنوان یک پروژه تئاتر شروع شد، در نهایت ابزارهای جدیدی برای درک چیزهای زیادی در مورد جهان به ما می دهد.»

https://techxplore.com

برچسب ها : پیش بینی, پیکان زمان, زبان های برنامه نویسی, هوش مصنوعی

آیا این نوشته برایتان مفید بود؟

بله 1 خیر 0

مشاهده پست »

4 تیر 1404 بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

تازه ها

نوآوری در مدیریت برای توسعه پایدار

Kolnegar Private Media (Management Innovation for Sustainable Development)

22 تیر 1404 7:54 ق.ظ

اثر پیکان زمان در پیش بینی های هوش مصنوعی

آیا این نوشته برایتان مفید بود؟

گروه تحقیق کل نگار

افزایش برد خودروهای برقی با فناوری پیش‌بینی دمای موتور الکتریکی

هوش مصنوعی جدید MIT برای طراحی ربات‌هایی که ۴۱٪ بالاتر می‌پرند و ایمن فرود می‌آیند

استفاده از Snap Spectacles و هوش مصنوعی Gemini، برای مسدودکردن تبلیغات

رونمایی از اولین مدل هوش مصنوعی جهان که سرطان معده را در مراحل اولیه تشخیص می‌دهد

جهانی شدن شرکت‌های چینی تراشه‌های کابین هدایت خودروهای برقی

ByteDance به یک شرکت جواهرات کمک می‌کند تا عینک‌ هوش مصنوعی را عرضه کند

دیدگاهتان را بنویسید لغو پاسخ

آشنایی متخصصان و فناوران با فرآیند دانش‌بنیان شدن

هم‌افزایی منطقه‌ای برای شکل‌گیری شبکه نوآوری شرق کشور؛

فناوری نوآورانه و نوآوری‌های آینده‌نگر

افزایش بهره‌وری بریتانیا با گذار به انرژی سبز

توزیع ایستگاه‌های سوخت‌گیری هیدروژن در اروپا ، تقاضاهای فردی را برآورده نمی‌کند

حمل 4000 خودرو با بزرگترین کشتی دوگانه سوز و انرژی خورشیدی جهان

شبکه نوآوری کیا

تازه ها

آشنایی متخصصان و فناوران با فرآیند دانش‌بنیان شدن

هم‌افزایی منطقه‌ای برای شکل‌گیری شبکه نوآوری شرق کشور؛

فناوری نوآورانه و نوآوری‌های آینده‌نگر

افزایش بهره‌وری بریتانیا با گذار به انرژی سبز

توزیع ایستگاه‌های سوخت‌گیری هیدروژن در اروپا ، تقاضاهای فردی را برآورده نمی‌کند

حمل 4000 خودرو با بزرگترین کشتی دوگانه سوز و انرژی خورشیدی جهان

افزایش برد خودروهای برقی با فناوری پیش‌بینی دمای موتور الکتریکی

الکترون‌های داغ نقاط کوانتومی پیوندهای سخت را می‌شکنند

توسعه ماده‌ای جدید و رادیکال برای ترمیم لایه شکننده در سلول‌های خورشیدی پروسکایت

پردرآمدترین مشاغل در آلمان

کل نگار را در شبکه های اجتماعی دنبال کنید

© تمامی حقوق این سایت برای کل نگار محفوظ بوده و درج مطالب سایت و بازنشر آن با ذکر منبع و آدرس سایت بلامانع است .

ورود به حساب کاربری

اثر پیکان زمان در پیش بینی های هوش مصنوعی

آیا این نوشته برایتان مفید بود؟

گروه تحقیق کل نگار

دیدگاهتان را بنویسید لغو پاسخ