سیما رادمان

سیما رادمان

دانشجوی مهندسی مخابرات؛ اهل تهران، همیشه در حال یادگیری

هوش مصنوعی Grok-1.5 Vision معرفی شد. رقبای GPT-4V در درک تصاویر و نمودارها

هوش مصنوعی Grok-1.5 Vision معرفی شد؛ رقیب GPT-4V در درک تصاویر و نمودارها

Grok-1.5 ویژن به‌زودی برای افراد منتخب و برخی از کاربران فعلی چت‌بات متعلق به xAI در دسترس قرار می‌گیرد.

مدتی پیش استارتاپ هوش مصنوعی «ایلان ماسک» یعنی xAI نسخه جدید چت‌بات خود Grok-1.5 را معرفی کرد. حالا در ادامه رقابت این شرکت با OpenAI، مدل چندوجهی Grok-1.5 Vision یا Grok-1.5V رونمایی شد. این هوش مصنوعی اکنون علاوه‌بر آنکه می‌تواند متن را درک کند، قادر به پردازش نمودار، اسکرین‌شات‌ و تصاویر گوناگون است.

براساس اعلام xAI، نسخه Grok-1.5V می‌تواند با مدل‌های چندوجهی پیشرفته دیگر در بخش‌هایی مثل استدلال چند رشته‌ای، درک نمودارهای علمی، چارت‌ها و تصاویر رقابت کند. Grok-1.5 ویژن به‌زودی برای افراد منتخب و برخی از کاربران فعلی این چت‌بات در دسترس خواهد بود.

Grok ویژن با قابلیت پردازش داده‌های تصویری و چندوجهی

xAI نسخه چندوجهی Grok را در هفت بنچمارک مختلف با دیگر رقبا مانند GPT-4V مقایسه کرده است که در برخی از آن‌ها این مدل برتری قابل‌توجهی را به‌ثبت رسانده است. خواندن متن در تصویر، فهم مسائل ریاضی، تبدیل فلوچارت به کد پایتون، تولید یک داستان از نقاشی و تبدیل جدول به فرمت فایل CSV از قابلیت‌های جدید نسخه ویژن Grok است.

هوش مصنوعی Grok-1.5 Vision معرفی شد؛ رقیب GPT-4V در درک تصاویر و نمودارها
مقایسه Grok-1.5V با دیگر رقبا در بنچمارک‌های مختلف

xAI مدل چندوجهی خود را با رقیب‌هایی مثل GPT-4V ،Claude 3Sonnet و جمینای پرو 1.5 مقایسه کرده است و ادعا می‌کند که Grok-1.5V در بنچمارک RealWorldQA از رقبای خود بهتر عمل می‌کند؛ این بنچمارک جدید برای ارزیابی میزان درک دنیای واقعی ایجاد شده است.

بنچمارک RealWorldQA با استفاده از بیش از 700 تصویر به همراه پرسش‌وپاسخ برای هر مورد ایجاد شده است. در این تصاویر وسایل نقلیه گوناگون و اشیای دنیای واقعی وجود دارند. xAI این بنچمارک را با مجوز CC یا Creative Commons برای عموم منتشر می‌کند.

هوش مصنوعی Grok-1.5 Vision معرفی شد؛ رقیب GPT-4V در درک تصاویر و نمودارها
در اینجا Grok یک فلوچارت را که روی وایت‌برد کشیده شده است به کد پایتون تبدیل می‌کند.

شرکت هوش مصنوعی ایلان ماسک از زمانی که چت‌بات آن برای اولین‌بار در سال 2023 رونمایی شد، پیشرفت‌های زیادی داشته است و دائماً نیز تلاش می‌کند تا با OpenAI و دیگر شرکت‌های پیشتاز هوش مصنوعی رقابت کند. اما این چت‌بات در این مدت چندان بی‌حاشیه نیز نبوده است. اخیراً محققان دریافتند که چت‌بات Grok می‌تواند به کاربران درباره اقدامات مجرمانه اطلاعاتی بدهد.

بااین‌وجود، xAI به‌دنبال ساختن «هوش جامع مصنوعی سودمند» با قابلیت درک جهان است. این هدف نشان می‌دهد که در ماه‌های آینده به‌روزرسانی‌های قابل توجهی برای درک چندوجهی و قابلیت‌های هوش مصنوعی مولد به Grok خواهد آمد.

سیما رادمان
سیما رادمان دانشجوی مهندسی مخابرات؛ اهل تهران، همیشه در حال یادگیری

شاید خوشتان بیاید

پاسخ ها

نظر خود را درباره این پست بنویسید
منتظر اولین کامنت هستیم!
آیدت: فروش فایل، مقاله نویسی در آیدت، فایل‌های خود را به فروش بگذارید و یا مقالات‌تان را منتشر کنید👋