Kyle Wiggers -22 آوریل 2023-لوگوی OpenAI-اعتبار تصویر: OpenAI
تلاش سیلیکون ولی برای خودکار کردن همه چیز بی وقفه است، که آخرین حاصل آن را توضیح می دهد: Auto-GPT.
در اصل، Auto-GPT از تطبیق پذیری آخرین مدلهای هوش مصنوعی OpenAI برای تعامل با نرمافزار و سرویسهای آنلاین استفاده میکند و به آن اجازه میدهد تا بهطور خودکار وظایفی مانند X و Y را انجام دهد. اما همانطور که ما در حال یادگیری با مدلهای زبان بزرگ هستیم، به نظر میرسد که این قابلیت به وسعت یک اقیانوس اما به عمق یک گودال وجود دارد..
Auto-GPT که ممکن است اخیراً در رسانه های اجتماعی خبر روز شده باشد – یک برنامه متن باز است که توسط توسعه دهنده بازی بروس ریچاردز ایجاد شده است که از مدل های تولید متن OpenAI، عمدتا GPT-3.5 و GPT-4، برای عمل “خودکار” استفاده می کند.
هیچ جادویی در آن خودمختاری وجود ندارد Auto-GPT به سادگی پیگیری های اولیه مدل های OpenAI را انجام می دهد، تا زمانی که یک کار کامل شود، آنها را می پرسد و پاسخ می دهد.
Auto-GPT، اساسا، GPT-3.5 و GPT-4 است که با یک ربات همراه جفت شده است که به GPT-3.5 و GPT-4 دستور می دهد که چه کاری انجام دهند. یک کاربر به Auto-GPT می گوید که هدفش چیست و ربات نیز به نوبه خود از GPT-3.5 و GPT-4 و چندین برنامه برای انجام هر مرحله لازم برای رسیدن به هدفی که تعیین کرده است استفاده می کند.
چیزی که Auto-GPT را تا حدی معقول میسازد، توانایی آن در تعامل با برنامهها، نرمافزارها و سرویسهای آنلاین و محلی است، مانند مرورگرهای وب و پردازشگرهای کلمه. به عنوان مثال، با توجه به درخواستی مانند “به من کمک کنید تجارت گل خود را توسعه دهم”، Auto-GPT می تواند یک استراتژی تبلیغاتی تا حدودی قابل قبول ایجاد کند و یک وب سایت اساسی بسازد.
#AutoGPT فرزند مخرب جدید در بلوک است- میتواند استدلال #ChatGPT را برای مسائل گستردهتر و پیچیدهتر که نیاز به برنامهریزی و چند مرحله دارد، اعمال کند.
همانطور که جو کوئن، یک توسعهدهنده نرمافزاری که با Auto-GPT آزمایش کرده است، از طریق ایمیل به TechCrunch توضیح داد، Auto-GPT اساساً پروژههای چند مرحلهای را خودکار میکند که نیاز به اعلانهای رفت و برگشتی با یک مدل هوش مصنوعی مبتنی بر چتبات دارند، مثلاً. ، ChatGPT OpenAI.
کوئن گفتAuto-GPT عاملی را تعریف می کند که با API OpenAI ارتباط برقرار می کند. «هدف این عامل اجرای دستورات مختلفی است که هوش مصنوعی در پاسخ به درخواستهای عامل ایجاد میکند. از کاربر خواسته می شود تا قبل از اینکه عامل شروع به اجرای دستورات کند، نقش و اهداف هوش مصنوعی را مشخص کند.”
در یک ترمینال، کاربران نام، نقش و هدف عامل Auto-GPT را توصیف می کنند و حداکثر پنج راه را برای دستیابی به آن هدف مشخص می کنند. مثلا:
نام: Smartphone-GPT
نقش: هوش مصنوعی طراحی شده برای یافتن بهترین گوشی هوشمند
هدف: یافتن بهترین گوشی های هوشمند موجود در بازار
هدف 1: تحقیقات بازار برای گوشی های هوشمند مختلف موجود در بازار امروز انجام دهید
هدف 2: پنج گوشی هوشمند برتر را دریافت کنید و مزایا و معایب آنها را فهرست کنید
در پشت صحنه، Auto-GPT به ویژگی هایی مانند مدیریت حافظه برای اجرای وظایف، همراه با GPT-4 و GPT-3.5 برای تولید متن، ذخیره سازی فایل و خلاصه سازی متکی است.
Auto-GPT همچنین می تواند به سینت سایزرهای گفتار، مانند ElevenLabs متصل شود، به طوری که به عنوان مثال می تواند تماس های تلفنی را برقرار کند.
Auto-GPT به صورت عمومی در GitHub در دسترس است، اما برای راهاندازی و اجرا به برخی تنظیمات و دانش نیاز دارد. برای استفاده از آن، Auto-GPT باید در یک محیط توسعه مانند Docker نصب شود، و باید با یک کلید API از OpenAI ثبت شود – که به یک حساب OpenAI پولی نیاز دارد.
ممکن است ارزشش را داشته باشد – اگرچه برخی این موضوع را قبول ندارند. پذیرندگان اولیه از Auto-GPT برای انجام انواع کارهای پیش پا افتاده استفاده کرده اند که بهتر به یک ربات واگذار می شود. برای مثال، Auto-GPT میتواند مواردی مانند اشکالزدایی کد و نوشتن ایمیل یا چیزهای پیشرفتهتری مانند ایجاد یک طرح کسبوکار برای یک استارتآپ جدید را وارد کند.
عدنان مسعود، معمار ارشد در UST، یک شرکت مشاوره فناوری، گفت: «اگر Auto-GPT با هر گونه مانع یا ناتوانی در تکمیل کار مواجه شود، دستورات جدیدی را برای کمک به موقعیت و تعیین گام های بعدی مناسب ایجاد می کند. مدلهای زبان بزرگ در ایجاد پاسخهایی شبیه به انسان برتری دارند، اما برای ارائه نتایج دلخواه به پیامهای کاربر و تعاملات متکی هستند. در مقابل، Auto-GPT از قابلیتهای پیشرفته API OpenAI استفاده میکند تا بهطور مستقل بدون دخالت کاربر عمل کند.
در هفتههای اخیر، اپلیکیشنهای جدیدی ظاهر شدهاند که استفاده از Auto-GPT را حتی آسانتر میکنند، مانند AgentGPT و GodMode، که یک رابط کاربری ساده را ارائه میکنند که در آن کاربران میتوانند آنچه را که میخواهند مستقیماً در یک صفحه مرورگر وارد کنند. توجه داشته باشید که مانند Agent-GPT، هر دو به یک کلید API از OpenAI نیاز دارند تا قابلیتهای کامل خود را باز کنند.
با این حال، مانند هر ابزار قدرتمندی، Auto-GPT محدودیتها و خطرات خود را دارد.
بسته به هدفی که ابزار ارائه شده است، Auto-GPT می تواند به روش های بسیار غیرمنتظره ای رفتار کند. یکی از کاربران Reddit ادعا می کند که با توجه به بودجه 100 دلاری برای خرج کردن در یک نمونه سرور، Auto-GPT یک صفحه ویکی روی گربه ها ایجاد کرد، از یک نقص در نمونه برای دسترسی به سطح مدیریت سوء استفاده کرد و محیط پایتون را که در آن قرار داشت تحت کنترل گرفت.
همچنین ChaosGPT، یک نسخه اصلاح شده از Auto-GPT با اهدافی مانند «از بین بردن بشریت» و «برقراری سلطه جهانی» وجود دارد. جای تعجب نیست که ChaosGPT به ایجاد آخرالزمان ربات نزدیک نشده است – اما در توییتی نسبتاً نامطلوب در مورد نوع بشر منتشر کرده است.
البته خطرناکتر از تلاش Auto-GPT برای «نابودی بشریت»، مشکلات پیشبینی نشدهای هستند که میتوانند در سناریوهای کاملاً عادی ظاهر شوند. از آنجا که بر روی مدلهای زبان OpenAI ساخته شده است – مدلهایی که مانند همه مدلهای زبانی مستعد عدم دقت هستند – میتواند خطا ایجاد کند.
این تنها مشکل نیست. پس از انجام موفقیت آمیز یک کار، Auto-GPT معمولاً نحوه اجرای آن را برای استفاده بعدی به خاطر نمی آورد و – حتی زمانی که انجام می دهد – اغلب استفاده از برنامه را به خاطر نمی آورد.Auto-GPT همچنین برای تقسیم مؤثر وظایف پیچیده به وظایف فرعی سادهتر تلاش میکند و در درک نحوه همپوشانی اهداف مختلف مشکل دارد.
Clara Shih، مدیر عامل Salesforce’s Service Cloud و یکی از علاقه مندان Auto-GPT، از طریق ایمیل گفت: Auto-GPT قدرت و خطرات ناشناخته هوش مصنوعی مولد را نشان می دهد. برای شرکتها، در هنگام توسعه و استفاده از فناوریهای هوش مصنوعی مانند Auto-GPT، بسیار مهم است که انسان را در رویکرد حلقه قرار دهند.