کاربران احتمالاً بهزودی بتوانند برای Grok تصویر بفرستند تا باتوجه به آن مکالمه داشته باشند.
طبق اسناد عمومی توسعهدهندگان شرکت هوش مصنوعی xAI، این شرکت درحال افزودن قابلیت پردازش ورودیهای چندوجهی به چتبات Grok خود است. این بدان معناست که بهزودی، کاربران ممکن است بتوانند برای Grok تصویر بفرستند تا باتوجه به آن با هوش مصنوعی مکالمه داشته باشند.
حدود یک ماه پیش شرکت هوش مصنوعی «ایلان ماسک»، یعنی xAI، نسخه Grok-1.5 Vision را معرفی کرد که برای تعدادی از کاربران محدود در دسترس قرار گرفت. این نسخه از Grok میتواند نمودار، اسکرینشات و تصاویر را پردازش کند. اکنون به گزارش ورج و طبق آخرین آپدیت اسناد توسعهدهندگان، توسعه این مدل درحال پیشرفت است و احتمالاً بهزودی در دسترس قرار میگیرد.
بهطورکلی، باتوجه به پیشرفت هوش مصنوعیهای گوگل و OpenAI که در روزهای گذشته عملکرد خیرهکننده آنها را در پردازش بلادرنگ صدا و تصویر دیدیم، بعید نیست که شرکت ایلان ماسک نیز در این رقابت از قابلیتهای چندوجهی هوش مصنوعی خود رونمایی کند.
طبق سند موجود، یک نمونه از اسکریپت پایتون وجود دارد که نشان میدهد چگونه توسعهدهندگان میتوانند از SDK یا کتابخانه کیت توسعه نرمافزار xAI برای ایجاد پاسخ براساس متن و تصاویر استفاده کنند. این اسکریپت پس از خواندن یک فایل تصویری و پرامپت متنی، به کاربر پاسخ میدهد.
این قابلیت یک آپدیت بزرگ برای Grok محسوب خواهد شد. شرکت xAI برای اولینبار در نوامبر 2023 این چتبات را رونمایی کرد و کاربران پریمیوم پلاس ایکس میتوانند از آن استفاده کنند. این هوش مصنوعی با دادههای متنی از منابع عمومی در اینترنت تا سهماهه سوم 2023 آموزش دیده و در فرایند آموزش آن از پستهای شبکه اجتماعی ایکس استفاده نشده است.
شرکت xAI توسط ایلان ماسک در مارس 2023 (اسفند 1401) تأسیس شد، بااینحال در زمینه هوش مصنوعی شرکت نوپایی محسوب میشود و از رقبایی مانند OpenAI عقبتر است. البته xAI میگوید که مدل Grok 1.5 آنها دارد به GPT-4 در بنچمارکهای مختلف نزدیک میشود.
پاسخ ها