12 مه 2023 – رابط کاربری ChatGPT روی صفحه نمایش گوشی هوشمند روی صفحه کلید دیده می شود، عکس نیکوس پکیاریدیس/NurPhoto از طریق رویترز
چت رباتهای مبتنی بر هوش مصنوعی مانند ChatGPT این پتانسیل را دارند که همه چیز را از پیمایش رسانههای اجتماعی به کل صنایع مرتبط کنند – و سریعتر از چیزی که ویلیام مارسلینو حتی چند ماه پیش تصور میکرد.
مارسلینو، دانشمند ارشد رفتاری و اجتماعی در RAND و استاد دانشکده فارغ التحصیل Pardee RAND، کار خود را به عنوان یک زبان شناس پیکره ای، کار با مجموعه داده های بزرگ، و به عنوان یک جامعه-زبان شناس، به گفته خودش، “نوع قدیمی و کیفی” آغاز کرد. آن، “کسی که می رود بین مردم زندگی کند تا زبان آنها را بیاموزد.”
اکنون، او خود را در تقاطع این دو رشته میبیند و برنامههای هوش مصنوعی مولد را مطالعه میکند که شبیه انسان صحبت میکنند – و در برخی موارد حتی شبیه انسانها هستند – اما در واقع از تریلیونها نقطه داده جمعآوریشده از اینترنت نیرو میگیرند.
ما با مارسلینو در مورد گسترش سریع دسترسی هوش مصنوعی، چالشهایی که میتواند برای جامعه و سیاستگذاران ایجاد کند، و اینکه چگونه جامعه پژوهشی آماده کمک است، صحبت کردیم.
هوش مصنوعی مولد دقیقا چیست؟
هوش مصنوعی ویلیام مارسلینو Generative به دستهای از مدلها اشاره میکند که چون آنچه قبلاً انجام شده را دیدهاند، میتوانند کار خوبی انجام دهند و حدس بزنند که چه کاری ممکن است انجام شود. یک مثال می تواند مدل های زبان بزرگ یا LLM باشد که چارچوب پشت برنامه هایی مانند ChatGPT هستند.
در یک سطح بسیار ابتدایی، ChatGPT بر روی – ما فکر میکنیم – تریلیونها نشانه زبان طبیعی جمعآوریشده از اینترنت، بهعلاوه «دادههای شخص ثالث» برای GPT-4 آموزش دیده است، که هیچکس دقیقاً معنی آن را نمیداند. مثلاً برای یک تولیدکننده ویدیوی متن به تصویر هم همینطور است. در این صورت، می تواند آنچه را که قبلاً نشان داده شده است، بگیرد. و از آن، چه چیزی را می توان نشان داد؟
این برنامهها اساساً کلمات، تصاویر، دادههای صوتی – هر یک از این موارد – را به اعداد بسیار طولانی به نام جاسازی تبدیل میکنند. این اعداد طولانی، علاوه بر اینکه تصویر یا کلمه را نشان میدهند، حاوی اطلاعات متنی نیز هستند، مانند اینکه آن تصویر یا کلمه معمولاً چگونه استفاده میشود یا معمولاً با چه چیزی مرتبط است. مدلهای تبدیل متن به تصویر مانند DALL-E یا Midjourney اینگونه عمل میکنند. متن از یک کاربر به یک فضای نهفته تعبیه شده که مربوط به تصاویر است، نمایش داده می شود، که سپس می توان آن را “طراحی” کرد، یا در واقع، از نویز پنهان کرد.
جالبتر – اما نگرانکنندهتر – این است که LLMها رفتار عاملی از خود نشان دادهاند. LLM ها می توانند ورودی های کاربر را دریافت کنند، دوره های عملی را ارائه دهند، آن اقدامات را انجام دهند، نتایج را ارزیابی کنند، سپس تکرار و اصلاح کنند تا زمانی که به هدف خود برسند.
فرصت ها و چالش های زیادی در کنار هوش مصنوعی وجود دارد. بیایید با اولی شروع کنیم: در مورد این فناوری چه چیزی شما را هیجان زده می کند؟
میدانی، تمام زندگیام منتظر کامپیوتر Star Trek بودم که بتواند با شما به زبان طبیعی صحبت کند. و می دانید که RAND به این ایده کمک کرد، درست است؟
شما چند سال پیش در مورد آن در لس آنجلس تایمز نوشتید.این ایده که ما میتوانیم این رابطهای کامپیوتری را جایگزین کنیم که استفاده از آنها درهم و سخت است و فقط با آنها صحبت کنیم، باورنکردنی است.
من کردم! میدانید، این ایده که ما میتوانیم این رابطهای کامپیوتری را جایگزین کنیم که استفاده از آنها سخت است و فقط با آنها صحبت میکنیم، باور نکردنی است. به عنوان یک زبان شناس 13 سال پیش، من چند نرم افزار داشتم که به من اجازه می داد کارهایی انجام دهم. بعداً کدنویسی آسانتر شد. و حالا، وقتی میخواهم چیزی را کدنویسی کنم، آنچه را که میخواهم تجزیه و تحلیل کنم به صورت مفهومی برای یک LLM توضیح میدهم، و این به من کمک میکند تا کدنویسی کنم.
ما همچنین اکنون توانایی انجام کارهای بسیار جالب و مفید را داریم. جالبترین پروژهای که تا به حال با آن درگیر بودهام، چیزی است که در حال حاضر در RAND با پیتر شیرمر، مدیر RAND برای تحقیقات و روشهای نوظهور سیاست، و Zev Winkelman، دانشمند ارشد اطلاعات، روی آن کار میکنم. ما در حال ساخت ابزاری با هدف کوچکتر و شبیه به ChatGPT برای ارتش ایالات متحده هستیم. ما به آن آموزش می دهیم که چگونه مانند یک سرباز صحبت کند، چگونه دانش ارتش را در مورد دکترین و فرهنگ درک کند، به عنوان منبعی برای اعضای خدمت سربازی. من قبل از اینکه افسر شوم یک تفنگدار نیروی دریایی بودم و کمی شیطنت می کردم. بنابراین، ما تصور می کنیم: چگونه می توانید این چیز را مفید و خوب کنید، اما ممکن است در برابر کسی که فقط می خواهد یک جور شیطان باشد آسیب پذیر نباشد؟
و برخی از معاوضه ها و سناریوهای بالقوه خطرناک مرتبط با پیشرفت در هوش مصنوعی چیست؟
من فکر می کنم یکی از ابعاد امنیت ملی که اکنون باید با آن مقابله کنیم این است که انسان ها عادت دارند دنیا را با حواس فیزیکی خود تأیید کنند. دیدن یعنی باور کردن اما از همین چند ماه پیش، دیگر هیچ تضمینی وجود ندارد که آنچه در اینترنت می بینید واقعی باشد.
او اظهار داشت که آنها قصد دارند از این فناوری برای ایجاد آنچه که “راهنمایی افکار عمومی” به صورت آنلاین می نامند، برای سانسور هوش مصنوعی و “کمک به مردم در فکر کردن افکار صحیح” استفاده کنند. ما باید انتظار داشته باشیم که این نوع اطلاعات نادرست را ببینیم و آنچه را که ما آن را “astroturfing” می نامیم، که تبلیغاتی است که شبیه یک کمپین مردمی طراحی شده است – و این حس را القا می کند که بسیاری از مردم یک احساس را باور می کنند، در حالی که واقعاً درست یا واقعی نیست.
تحقیقات موجود چگونه میتواند به آمادهسازی مردم برای آنچه در این زمینه به سرعت در حال توسعه است کمک کند؟
این یکی از چالشهای هوش مصنوعی است – تحقیقات منتشر شده در جامعه علمی به معنای واقعی کلمه سالها از این فناوری عقب است. بنابراین، علاوه بر کارم در RAND، با منابع غیرسنتی مانند arXiv، یک آرشیو تحقیقاتی با دسترسی آزاد، و حتی فناوری زبان Reddit همگام هستم.
RAND تجربه زیادی در استفاده از یادگیری ماشینی برای انجام انواع کارها دارد – به عنوان مثال، تلاش برای پیش بینی اینکه آیا قراردادهای ارتش به طور کامل پول خود را خرج می کند یا خیر. این ایده که ما می توانیم از ماشین ها برای مدل سازی اشیا در مقیاس استفاده کنیم، برای ما تازگی ندارد.
من فکر می کنم نقطه قوت RAND در این زمینه این است که ما کارشناسانی از رشته های مختلف و تحلیلگران سیاست داریم که با هم در این زمینه کار می کنند. دانشمندان داده ما به سادگی در جایی در سازمان محو نمی شوند. ما دانشمندان دادهای داریم که در سرتاسر آنها پراکنده شدهاند، و سپس افرادی مانند من داریم که دانشمند داده نیستند، اما آنقدر این مفاهیم را درک میکنند تا بتوانند کاری با آنها در زمینههایی که ما میفهمیم انجام دهند. من فکر می کنم که واقعاً قدرتمند خواهد بود.