چند وقتی است که توجه دنیای تکنولوژی به رباتی تازه توسعهیافته به نام GPT-3 جلب شده که به زعم بسیاری قرار است دنیای هوش مصنوعی را دگرگون کند. اگر بخواهیم خیلی ساده توضیح دهیم: GPT-3 رباتی است که مهارت فراوان در ایجاد محتوا در ساختار رایج زبان انسانی و زبان ماشینی دارد و بسیار پیشرفتهتر از پیشینیان خود ظاهر میشود.
شرکت OpenAI مسئولیت ساخت GPT-3 را برعهده داشته، شرکتی تحقیقاتی که ایلان ماسک یکی از موسسین آن بوده و به عنوان یکی ستونهای اصلی پیشرفت هوش مصنوعی در سالهای پیش رو تلقی میشود.
اما به همان اندازه که مردم برای این ربات هیجانزدهاند، اطلاعات اندکی نیز راجع به کارهایی که میتواند (و نمیتواند) انجام دهد نیز دارند. بنابراین در این مقاله با زبان بسیار ساده مسائل پیرامون GPT-3 را تشریح خواهیم کرد تا درک بهتری از ماهیت آن داشته باشید. علاوه بر این به برخی از مشکلات بالقوه این هوش مصنوعی خواهیم پرداخت و اینکه چرا برخی عقیده دارند به خاطر هیجان بیش از حد، برخی از برجستهترین تواناییهای ربات OpenAI نادیده گرفته شده است.
کار را با سادهترین مسائل شروع میکنیم. GPT-3 مخفف «Generative Pre-trained Transformer 3» است و در واقع ورژن سوم از این ابزار است که هنوز در دسترس عموم قرار نگرفته.
اگر بخواهیم خلاصه بگوییم، نامگذاری GPT-3 بدان معناست که میتواند با استفاده از الگوریتمهایی که از پیش تعلیم دیدهاند، متن تولید کند. این الگوریتمها از قبل اطلاعات لازم برای انجام وظایف خود را دریافت کردهاند. دقیقتر میگوییم، این ربات با ۵۷۰ گیگابایت اطلاعات جمعآوری شده از سطح اینترنت (چه در دیتابیسهای عمومی و چه خصوصی) تعلیم دیده و OpenAI هم برخی دیگر از متون (مانند مقالات ویکیپدیا) را دستچین کرده و در اختیار ربات قرار داده.
اگر از این ربات یک سوال بپرسید، میتوانید منتظر پاسخی بسیار کارآمد باشید. اگر هم از آن بخواهید که یک خلاصه از مقاله یا یک شعر بنویسد، دقیقا همین کارها را برایتان خواهد کرد. اگر فنیتر با موضوع برخورد کنیم، این ربات به عنوان بزرگترین شبکه عصبی مصنوعی جهان شناخته میشود و جلوتر به این موضوع هم خواهیم پرداخت.
GPT-3 قادر به هرچیزی درون ساختار زبان است. بنابراین میتواند به سوالات پاسخ دهد، مقاله بنویسد، متون طولانی را خلاصه کند، زبانها را ترجمه کند، نت بردارد و حتی کد کامپیوتری بنویسد.
در واقع در یک دموی آنلاین دیدهایم که این ربات قادر به ساخت اپلیکیشنی با کارکرد بسیار مشابه به اینستاگرام است. GPT-3 در این راه از پلاگین Figma استفاده کرده که به صورت گسترده برای طراحی اپلیکیشن از سوی توسعهدهندگان استفاده میشود.
چنین اتفاقی بدیهتا بسیار انقلابی است و اگر در طولانیمدت نیز قابل استفاده و کارآمد باشد، میتواند تاثیری شگرف روی چگونگی توسعه نرمافزار و اپلیکیشن در آینده بگذارد. از آنجایی که سورس کد این ربات هنوز به صورت عمومی منتشر نشده، دسترسی به GPT-3 تنها از طریق رابط برنامهنویسی توسعه یافته از سوی OpenAI امکانپذیر است. از زمانی که این رابط برنامهنویسی در ماه ژوئن امسال در دسترس قرار گرفت، شاهد ظهور انبوهی از متون مختلف مانند شعر، نثر، گزارشهای خبری و نوشتههای علمی-تخیلی بودهایم.
GPT-3 چند وقت پیش یک مقاله بسیار جالب برای خبرگزاری گاردین نوشت و با لحنی بسایر متقاعدکننده توضیح داد که چرا انسانها نباید از هوش مصنوعی و خطرات بالقوه آن بترسند. با این همه GPT-3 در بخشی از مقاله خود اعتراف کرد که اگر افراد شرور آن را مجبور به کارهای شرورانه کنند «نمیتوانم از نابودی گونه بشری جلوگیری کنم».
از منظر اینکه ربات OpenAI در کدام دستهبندی کلی از هوشهای مصنوعی قرار میگیرد باید گفت که GPT-3 یک مدل پیشبینی زبان است. این یعنی GPT-3 یک ساختار الگوریتم است که طراحی شده تا یک تکه از زبان (یعنی یک ورودی) را برداشته و آن را تبدیل به چیزی کند که بنابر پیشبینی خودش، کارآمدترین بخش از زبان برای کاربر است.
تمام اینها به لطف متونی است که در فاز «پیشتعلیم» به صورت گسترده در اختیار هوش مصنوعی قرار گرفتهاند. برخلاف الگوریتمهای دیگر که در وضعیت خالص خود هیچ تعلیمی ندیدهاند، OpenAI همین حالا انبوهی از منابع کامپیوتری ضروری را در اختیار GPT-3 قرار داده تا درکی درست از کارکرد زبان و ساختار آن داشته باشد. گفته میشود تمام تلاش و وقتی که OpenAI صرف تعلیم دادن این هوش مصنوعی کرده بالغ بر ۴.۶ میلیون دلار هزینه داشته است.
برای یادگیری اینکه ساختارهای رایج زبان -مانند جملات- چطور کار میکنند، GPT-3 از تحلیل معنایی استفاده میکند. این یعنی ربات نهتنها کلمات و معنای آنها را تحلیل میکند، بلکه درکی کلی از چگونگی استفاده از کلمات در کنار کلمات دیگر متن به دست میآورد.
GPT-3 ضمنا یک فرم از یادگیری ماشین است که بدون نیاز به نظارت، روند یادگیری را طی میکند. این بدان خاطر است که هیچکدام از دادههای آموزشی ربات «درست» یا «غلط» تلقی نمیشوند. تمام اطلاعاتی که ربات برای محاسبه سازگاری خروجی با نیاز کاربر لازم دارد، درون خود متن است و بنابراین نظارت انسانی ضروری به حساب نمیآید. GPT-3 این کار را با مطالعه روی موارد استفاده از کلمات و جملات به انجام میرساند، بعد آنها را از یکدیگر جدا کرده و دوباره خود بازنویسی میکند.
برای مثال در جریان روند تعلیم، الگوریتم ممکن است با جمله «خانه دری قرمز رنگ دارد» مواجه شود. بعد همین جمله به صورت مجدد، اما بدون یکی از کلمات در اختیار ربات قرار میگیرد. مانند «خانه X قرمز رنگ دارد». در این مرحله، GPT-3 تمام متون موجود در داده آموزشی را اسکن میکند -دادههایی شامل هزاران میلیارد کلمه که به شکل زبان قابل فهم کنار یکدیگر چیده شدهاند- و تصمیم میگیرد که کدام کلمه برای بازسازی جمله اصلی مناسب خواهد بود.
در ابتدای کار احتمالا ربات دست به اشتباه فراوان میزند. در واقع میلیونها بار اشتباه میکند. اما در نهایت قادر به یافتن کلمه درست خواهد بود. با چک کردن داده ورودی اصلی، ربات میفهمد که از خروجی درست استفاده کرده و یک امتیاز «وزن» به آن پروسه الگوریتم که به پاسخ درست دست یافته تعلق میگیرد. این یعنی ربات به صورت آهسته اما پیوسته «میآموزد» که کدام متدها برای رسیدن به پاسخ صحیح در آینده بهتر هستند.
باید اشاره کرد که کار GPT-3 آنقدرها تازه نیست و برای سالیان متمادی با مدلهای مختلف پیشبینی زبان مواجه بودهایم. اما وزنی که الگوریتم به صورت پویا در حافظه خود ذخیره کرده و برای هر کوئری به کار میگیرد معادل ۱۷۵ میلیارد است - یعنی ۱۰ برابر بیشتر از نزدیکترین رقیبش که توسط شرکت انویدیا توسعه یافته.
توانایی HPT-3 در تولید زبان به عنوان برترین نمونه در دنیای هوش مصنوعی تلقی میشود، اما باید به چند نکته دیگر نیز توجه داشت. مدیرعامل OpenAI، یعنی سم آلتمن خود گفته است که: «هیجان برای GPT-3 بیش از حد است. هوش مصنوعی قرار است چهره جهان را دگرگون کند، اما GPT-3 صرفا یک گام کوچک و زودهنگام در این مسیر است».
نخستین مشکل GPT-3 اینست که اکنون ابزاری بسیار گرانقیمت به حساب میآید، در واقع به این خاطر که به انبوهی از قدرت پردازشی برای انجام وظایف خود نیاز دارد. این یعنی هزینه استفاده از آن از بودجه بسیاری از سازمانهای کوچک فراتر خواهد بود.
مشکل دوم هم سیستم بسته و جعبه سیاه گونه GPT-3 است. OpenAI هیچوقت از جزییات مربوط به چگونگی کارکرد الگوریتم خود پرده برنداشته و بنابراین هرکسی که از آن برای پاسخ دادن به سوالات یا ساخت محصولات مفید استفاده میکند، نخواهد دانست این ربات چطور طراحی شده.
بعد به مشکل سوم میرسیم که بینقص نبودن خروجی سیستم است. اگرچه GPT-3 میتواند وظایفی مانند نوشتن متون کوتاه یا اپلیکیشنهای ساده را برعهده بگیرد، هنگامی که به سراغ متون طولانیتر و پیچیدهتر میرود کارایی کمتری از خود نشان میدهد. در واقع خروجیهای این ربات در چنین حالتی کاملا بیمعنی هستند.
در مجموع و برای جمعبندی باید گفت که GPT-3 نتایجی تولید میکند که بسیار بهتر از آنچه قبلا دیدهایم هستند. هرکسی که نتایج زبان هوش مصنوعی را دیده باشد میداند که نتایج میتوانند متغیر باشند، اما خروجی GPT-3 به شکلی بدون تردید مثل گامی بلند به سمت جلو به نظر میرسند. زمانی که بتوانیم شاهد استفاده عمومی از این ربات باشیم، آن موقع است که عملکرد ربات OpenAI حتی از قبل هم تحسینبرانگیزتر خواهد شد.
پاسخ ها