چتباتهای هوش مصنوعی امروزی تفاوت چشمگیری با چتباتهای قدیمی دارند، اما آنها چگونه میتوانند تا این اندازه با انسانها ارتباط خوبی برقرار کنند؟
از زمان عرضه ChatGPT، چتباتهای مبتنی بر هوش مصنوعی در تمرکز توجه قرار دارند و شرکتهای مختلف از چتباتهای خود رونمایی کردهاند. بسیاری از ما هنگام صحبت با این چتباتها حس میکنیم که درحال صحبت با یک انسان دیگر هستیم، اما چگونه چنین چیزی ممکن است؟
چتباتها میتوانند کارهای مختلفی برای ما انجام دهند؛ از صحبتکردن ساده گرفته تا ارائه اطلاعات درباره موضوع خاص یا خلاصهکردن مقالات. برخی از این چتباتها به اندازهای پیشرفته هستند که فکر نمیکنید درحال صحبت با یک ربات یا هوش مصنوعی هستید. بنابراین شاید برای شما هم این سؤال پیش آمده باشد که چگونه یک چتبات میتواند تا این اندازه شبیه انسانها با ما صحبت کنند. در این مقاله میخواهیم به این سؤال پاسخ دهیم، پس تا پایان همراه دیجیاتو باشید.
تا پیش از ظهور چتباتهایی مانند ChatGPT و بارد، چندین چتبات با عملکرد پایه و ابتدایی در دنیای فناوری وجود داشتند. این چتباتها یک سیستم قانون محور یا درخت تصمیمگیری داشتند. چتبات قانون محور نمیتواند خودش را با موقعیتها سازگار کند و همچنین قادر به درک محتوا و شبیهسازی منطق انسان نیست. درحقیقت این ابزارها دارای چندین قانون، الگو و درختهای گفتگو هستند که باید به آنها پایبند بمانند.
چتباتهای قانون محور زمانی که با آنها حرف میزنید، از شرایط از پیش تعیینشده پیروی میکنند. در اینجا کلیدواژهها اهمیت بالایی دارند و چتبات ورودیهای کاربران را برای پیداکردن کلمات خاص اسکن میکند. چنین چتباتهایی بدون اطلاع چندانی از محتوا، با استفاده از سرنخها به کاربر جواب میدهند.
این نوع چتباتها نمیتوانند به سؤالات بسیار پیچیده و لایهای پاسخ دهند و برای پاسخ به سؤالات ساده طراحی شدهاند. بنابراین اگر سؤال شما المانهای زیادی داشته باشد، چتباتهای قانون محور نمیتوانند پاسخ درست یا حداقل کاملی به آنها بدهند. بهخاطر محدودیتهای این نوع چتباتها، باید بهصورت دستی هرچند وقت یکبار آنها را ارتقا داد و بدون دخالت، عملکرد آنها بهبود نمییابد.
البته باید به این موضوع اشاره کنیم که چتباتهای مبتنی بر هوش مصنوعی هم از قوانین خاصی پیروی میکنند. برای مثال این چتباتها درباره برخی مسائل مانند کارهای مجرمانه به کاربران پاسخ نمیدهند. بااینحال عملکرد آنها بسیار پیشرفتهتر از چتباتهای قانون محور است.
قبل از اینکه ChatGPT مورد توجه قرار بگیرد، چتباتهای هوش مصنوعی دیگری هم در دنیای فناوری حضور داشتند که اگرچه کمتر پیشرفته بودند، اما همچنان از هوش مصنوعی برای ارتباط با کاربران استفاده میکردند.
برای مثال در سال 2008 چتبات Eviebot از راه رسید؛ چتباتی که برای ارتباط با کاربران از هوش مصنوعی استفاده میکرد. Evie با استفاده از متونی که کاربر در گذشته تایپ کرده بود، مهارت گفتاری خود را بهبود میبخشید. درحقیقت Evie از همان سیستم هوش مصنوعی که استفاده میکرد که Cleverbot به آن مجهز شده بود. Cleverbot نزدیک به یک دهه پیش مورد توجه قرار گرفت. بااینحال چتباتهای امروزی بسیار پیشرفتهتر هستند.
همانطور که در تصویر بالا مشاهده میکنید، Evie در پاسخ به سؤالات چندان دقیق نبود یا اینکه نمیتوانست تاریخچه گفتگوها را به یاد بسپارد. برای مثال Evie در ابتدا خودش را Eliza معرفی کرده و پس از چند ثانیه نام خودش را به Adam تغییر داده است.
علاوهبراین، Evie منبع اطلاعات مناسبی نبود. برای مثال زمانی که از Evie میپرسیدید «خورشید چقدر بزرگ است»، پاسخ میداد: «بزرگتر از آینده من». درحالت کلی چتباتهایی مانند Cleverbot و Evie اگرچه سرگرمکننده بودند، اما از نظر ارائه اطلاعات و گفتگو مناسب نمیتوانستید روی آنها حساب باز کنید. در اواخر 2022 اما شرایط تغییر کرد و هوش مصنوعی پیشرفته نشان داد که چتباتها میتوانند تا چه اندازه مفید باشند.
همچنان جواب سؤال اصلی باقی مانده است: چتباتهایی مانند ChatGPT چگونه میتوانند شبیه انسانها صحبت کنند؟ آنها چگونه طوری رفتار میکنند که گویی یک انسان پشت کیبورد نشسته و به سؤالات ما پاسخ میدهد؟
در نوامبر 2022، OpenAI چتبات ChatGPT را بهطور عمومی عرضه کرد تا اولین چتبات هوش مصنوعی که میتواند گفتگوهای مشابه انسان را شبیهسازی کند، به نمایش بگذارد.
GPT در نام ChatGPT یعنی «ترنسفورمر تولیدگر از پیش آموزشدیده» که نوعی از مدل زبانی بزرگ (LLM) محسوب میشود. احتمالاً در ماههای پیش عبارت مدل زبانی بزرگ زیاد به گوشتان خورده است، اما LLM چیست؟
LLM یک مدل یادگیری هوش مصنوعی است که توسط اکثر چتباتهای هوش مصنوعی امروزی استفاده میشود. این مدل زبانی توسط یک الگوریتم هوش مصنوعی کار میکند که برای فعالیت در سطوع بسیار پیشرفته، از یادگیری عمیق استفاده میکند. تمام LLMها توسط مجموعه دادههای بسیار بزرگ آموزش میبینند که به آنها دانش زیادی میدهد. برای مثال ChatGPT-4 با 1 تا 1.7 تریلیون پارامتر و چندین ترابایت دیتا آموزش داده شده است.
GPT یک نوع خاص از LLM شامل یک شبکه عصبی با قابلیت یادگیری عمیق است. GPTها مدلهای از پیش آموزشدیده با حجم انبوهی از اطلاعات برای یادگیری هستند. برای مثال برای آموزش ChatGPT از متون کتابها، مجلات و ... استفاده شده است. اما چگونه این چتباتها میتوانند مانند انسانها با ما صحبت کنند؟
در هنگام توسعه ChatGPT، شرکت OpenAI از روش «یادگیری تقویتی از بازخورد انسانی» (RLHF) استفاده کرد. این روش از آموزش از فرایند تقویت برای شکلگیری ChatGPT بهعنوان یک چتبات مناسب استفاده میکند. با یک مدل پاداش و بازخورد، ChatGPT میتواند از مفیدبودن یا نامناسببودن پاسخ خود مطلع شود. این روش همچنین به ChatGPT اجازه میدهد تا مکالمه را بهتر درک کند و پاسخهای مؤثرتری در اختیار کاربران قرار دهد.
پردازش زبان طبیعی ChatGPT هم نقش مهمی در نحوه پاسخگویی آن به کاربران ازجمله تشخیص الگوها و احساسات زبانی دارد. این چتبات در آموزش خود، از یک الگوریتم با نمونههایی از مکالمات انسانی برای درک بهتر نحوه ارتباط انسانها استفاده کرد. این الگوریتم همچنین میتواند مواردی مانند خوشآمدگویی و خداحافظی را برای نظارت روی مراحل مکالمه مدنظر داشته باشد.
اگرچه چتباتهای کنونی بسیار پیشرفته هستند، اما این پایان راه نخواهد بود. علاوه بر ChatGPT، شرکتهای دیگری مانند گوگل هم چتبات خود به نام بارد را در اختیار کاربران قرار دادهاند. اما این پایان راه نیست.
چتباتها با گذر زمان به مدلهای زبانی پیشرفتهتر مجهز میشوند. برای مثال چند وقت پیش GPT-4 از راه رسید و در ChatGPT مورد استفاده قرار گرفت. گوگل هم ظاهراً میخواهد در آینده در بادر از مدل زبانی Gemini استفاده کند. این مدلهای زبانی قابلیتهای بیشتری دارند و پیشرفتهتر از نسلهای قبلی خود هستند.
علاوهبراین، چتباتهای هوش مصنوعی میتوانند به رباتها هم راه پیدا کنند؛ رباتهای فیزیکی که به کمک چتباتها میتوانند بهتر با انسانها ارتباط برقرار کنند. بنابراین چتباتها هنوز جای پیشرفت دارند و شاید تازه در اول راه باشیم.
پاسخ ها