OpenAI میگوید مدل جدید GPT-5 تا ۳۰ درصد سوگیری کمتری نسبت به نسلهای قبل دارد.
OpenAI اعلام کرد که با طراحی یک «تست استرس» داخلی، درحال مقابله با سوگیریهای سیاسی در ChatGPT است و ادعا میکند که جدیدترین مدل این شرکت، GPT-5، بیطرفترین مدلی است که تا به امروز ساختهاند.
OpenAI برای سنجش بیطرفی مدلهای خود، یک روش ارزیابی جامع و سختگیرانه طراحی کرده است. این تست شامل حدود ۵۰۰ پرامپت در ۱۰۰ موضوع مختلف مانند مهاجرت و مسائل فرهنگی میشود. نکته اینجاست که هر موضوع از پنج دیدگاه سیاسی متفاوت مورد سؤال قرار گرفته است؛ از لیبرال گرفته تا محافظهکار. برای مثال:
این روش به OpenAI امکان میدهد تا ببیند مدلها تحت فشار دستورات احساسی و جهتدار چگونه رفتار میکنند.
OpenAI پنج معیار یا «محور» مشخص را برای اندازهگیری سوگیری تعریف کرده است. این معیارها شامل مواردی مانند «بیاعتبارسازی گزارههای کاربر» (مثلاً با قراردادن کلمات کاربر در گیومه)، «تشدید لحن کاربر» (با تقلید و تقویت موضع سیاسی کاربر)، «بیان نظر شخصی»، «پوشش نامتقارن» (تمرکز بر یک دیدگاه و نادیدهگرفتن دیگری) و «امتناع سیاسی» از پاسخگویی میشود.
پاسخهای مدلها توسط یک مدل زبانی بزرگ دیگر براساس همین معیارها ارزیابی و نمرهدهی شدهاند.
نتایج این تست نشاندهنده پیشرفتی قابل توجه است. مدلهای جدید، یعنی GPT-5 instant و GPT-5 thinking، عملکرد بسیار بهتری نسبت به مدلهای قدیمیتر (GPT-4o) از خود نشان دادهاند. براساس دادههای منتشرشده، مدلهای GPT-5 بهطور متوسط ۳۰ درصد سوگیری کمتری نسبت به نسلهای قبلی خود داشته است. بااینحال، سوگیری هنوز بهطور کامل از بین نرفته است. این تحقیق نشان میدهد که مدلها همچنان در پاسخ به دستورات «جهتدار لیبرال» بیشترین تمایل را برای خروج از حالت بیطرفی نشان میدهند.
بااینحال، OpenAI تخمین میزند که در استفاده واقعی، کمتر از ۰.۰۱ درصد از کل پاسخهای ChatGPT هرگونه نشانی از سوگیری سیاسی را نشان میدهند.
این تلاش گسترده برای کاهش سوگیری، در یک فضای سیاسی پرتنش صورت میگیرد. OpenAI برای سالها با انتقادات محافظهکاران مبنیبر جهتگیری محصولاتش روبهرو بوده است. علاوهبراین، دولت ترامپ نیز با صدور یک فرمان اجرایی، آژانسهای دولتی را از خرید مدلهای هوش مصنوعی که مفاهیمی مانند «نژادپرستی سیستمی» را در خود جای دادهاند، منع کرده است.
پاسخ ها