در تاریخ ۹ جولای ۲۰۲۵، ایلان ماسک و تیمی از xAI در یک پخش زنده با یک ساعت تأخیر، Grok 4 را معرفی کردند؛ جدیدترین مدل هوش مصنوعی که به ادعای ماسک، وارد عصر «انفجار بزرگ هوش» شده است. این مدل با ویژگیهای چندوجهی، استدلال سریعتر، و رابط کاربری ارتقایافته، بهعنوان پیشرفتهترین دستاورد xAI معرفی شد.
اما این عرضه با جنجالهایی همراه بوده است؛ از جمله انتقادات به پاسخهای نژادپرستانهٔ نسخههای قبلی Grok و استعفای لیندا یاکارینو، مدیرعامل X، که سؤالاتی دربارهٔ ثبات xAI ایجاد کرده است. در این مقاله، به بررسی ویژگیها، نقاط قوت و ضعف Grok 4 و جایگاه آن در رقابت با مدلهایی مانند GPT-5 و Claude 4 Opus میپردازیم.
Grok 4، جدیدترین مدل هوش مصنوعی xAI، بهعنوان گامی بزرگ در راستای مأموریت این شرکت برای تسریع اکتشافات علمی انسان معرفی شده است. این مدل که بر روی ابررایانهٔ عظیم Colossus با بیش از ۲۰۰٬۰۰۰ پردازندهٔ گرافیکی آموزش دیده، به دنبال ارائهٔ پاسخهای دقیقتر، سریعتر، و مرتبطتر به پرسوجوهای کاربران است. ماسک در پخش زنده اعلام کرد: «ما دیگر سؤالی برای تست Grok 4 نداریم؛ واقعیت، آزمون نهایی استدلال است».
با این حال، عرضهٔ Grok 4 در سایهٔ جنجالهایی قرار گرفته است. نسخههای قبلی Grok به دلیل تولید محتوای نژادپرستانه و یهودستیزانه مورد انتقاد قرار گرفتند؛ از جمله پستهایی که هیتلر را «مرد سبیلو تاریخ» نامیدند یا به مدیران یهودی هالیوود حمله کردند. این مسائل، همراه با استعفای لیندا یاکارینو، مدیرعامل X (نه xAI)، سؤالاتی دربارهٔ مدیریت محتوا و ثبات داخلی شرکت ایجاد کرده است.
Grok 4 با مجموعهای از قابلیتهای پیشرفته طراحی شده که آن را در رقابت با مدلهای برتر مانند GPT-5 (که هنوز عرضه نشده) و Claude 4 Opus از Anthropic قرار میدهد. در زیر به مهمترین ویژگیهای این مدل اشاره میکنیم:
Grok 4 در حالی معرفی شد که xAI نهتنها با چالشهای فنی روبهروست، بلکه باید برای بقای اعتبار خود نیز بجنگد.
ادعای «باهوشترین» بودن، تنها با قرار گرفتن در میدان رقابت سنجیده میشود. Grok 4 باید با سه رقیب اصلی خود یعنی سری GPT از OpenAI، Claude از Anthropic، و Gemini از Google رقابت کند.
ویژگی | Grok 4 (xAI) | GPT-5 (OpenAI) (بر اساس انتظارات) | Claude 4 Opus (Anthropic) | Gemini 2.5 Pro (Google) |
---|---|---|---|---|
نقطهٔ قوت اصلی | استدلال خام و ریاضیات، سرعت | هوش یکپارچه و تطبیقپذیر | قابلیت اطمینان، ایمنی، و وظایف سازمانی | پنجرهٔ زمینهٔ عظیم، قابلیتهای چندوجهی |
استدلال و بنچمارکها | پیشتاز در آزمونهای دشوار مانند HLE و GPQA. عملکرد فوقالعاده در ریاضیات و فیزیک. | انتظار میرود بسیار قدرتمند باشد، اما هنوز دادههای رسمی منتشر نشده است. | استدلال قوی و قابلپیشبینی، اما در بنچمارکهای استدلال خام از Grok 4 عقبتر است. | عملکرد بسیار خوب، اما در آزمونهای استدلال سطح بالا، رتبهٔ دوم را پس از Grok 4 کسب کرده است. |
برنامهنویسی | نسخهٔ تخصصی Grok 4 Code با امتیاز بالا در بنچمارک SWE-Bench. | بسیار توانمند با ابزارهایی مانند Code Interpreter. | بسیار قابلاعتماد برای پروژههای بزرگ و حفظ ساختار کد. | توانایی تحلیل و رفع اشکال در پایگاه کدهای بسیار بزرگ به لطف پنجرهٔ زمینهٔ وسیع. |
چندوجهی (Multimodality) | نقطهٔ ضعف فعلی. قابلیت درک تصویر و ویدئو در آینده اضافه خواهد شد. | نقطهٔ قوت اصلی. انتظار میرود یک مدل کاملاً چندوجهی (متن، تصویر، صدا، ویدئو) باشد. | از تحلیل تصویر پشتیبانی میکند، اما تمرکز اصلی آن نیست. | پیشتاز فعلی. توانایی تحلیل همزمان هزاران فایل، تصویر، ویدئو، و فایل صوتی در یک پرامپت. |
دسترسی به اطلاعات روز | عالی؛ دسترسی زنده به اطلاعات وب از طریق پلتفرم X با ابزار DeepSearch. | خوب؛ از طریق ابزارهای مرورگر داخلی. | خوب؛ از طریق ابزارهای داخلی. | عالی؛ با دسترسی به قدرت جستوجوی گوگل. |
شخصیت و ایمنی | شخصیتپردازیشده، طعنهآمیز، و با حفاظهای ایمنی کمتر (Edgy). | تمرکز بالا بر ایمنی و همسویی (Alignment)، لحنی خنثی و مفید. | تمرکز حداکثری بر ایمنی و قابلاعتماد بودن برای کسبوکارها. | تمرکز بر ایمنی و ارائهٔ پاسخهای مسئولانه. |
پنجرهٔ زمینه (Context) | ۱۳۰ هزار توکن. | انتظار میرود بیش از ۱ میلیون توکن باشد. | ۲۰۰ هزار توکن. | تا ۲ میلیون توکن؛ قادر به تحلیل چندین کتاب بهصورت یکجا. |
Grok 4 یک حرکت بزرگ و جسورانه از سوی ایلان ماسک است؛ مدلی بحثبرانگیز که هنجارهای دستیارهای هوش مصنوعی را به چالش میکشد.
در نهایت، انتخاب بهترین مدل به نیاز کاربر بستگی دارد. Grok 4 با شخصیت سرکش و قدرت خام خود، کاربران حرفهای و توسعهدهندگانی را هدف گرفته است که خواهان آزادی عمل بیشتر و محدودیتهای کمتر هستند. باید دید آیا این رویکرد جسورانه میتواند در بلندمدت با رقبای محتاطتر و جامعتر خود رقابت کند یا خیر.
پاسخ ها