این تصویر، برتریهای مدل GPT-4o نسبت به خانواده مدلهای GPT-4 و همچنین مدل تولید تصویر DALL-E 3 را نشان میدهد.
«گرگ براکمن»، رئیس OpenAI در شبکه اجتماعی ایکس پست جدیدی را منتشر کرده که به گفته او، اولین تصویر تولیدشده توسط مدل جدید GPT-4o این شرکت است.
تصویر منتشرشده توسط براکمن در ایکس، فردی را نشان میدهد که تیشرت مشکی با لوگوی OpenAI به تن دارد و در مقابل یک تخته سیاه ایستاده است. روی تخته، عبارت «انتقال بین روشها» و جملات دیگری با گچ نوشته شده است.
تصویر تولیدشده توسط مدل GPT-4o
مدل جدید GPT-4o روز دوشنبه معرفی شد، و OpenAI در نمایش خود گفت که این مدل در مقایسه با خانواده مدلهای GPT-4 بهبودیافتهتر است و علاوه بر سرعت بیشتر و قیمت پایینتر، میتواند اطلاعات بیشتری را از ورودیهای خود حفظ کند.
دلیل برتری مدل GPT-4o این است که OpenAI برای توسعه آن از رویکرد متفاوتتری نسبت به GPT-4 استفاده کرده است. در حالی که در مدلهای قبلی اساساً چندین مدل مختلف با یکدیگر ترکیب شدهاند و میتوانند فایلهای رسانهای مانند صدا و تصویر را به متن و عکس تبدیل کنند، مدل GPT-4o جدید از همان ابتدا روی توکنهای چندرسانهای آموزش داده شده است. با این وجود، دیگر مدل نیازی ندارد برای آنالیز و تفسیر صدا و تصویر، آنها را به متن تبدیل کند.
طبق تصویر منتشرشده، بهنظر میرسد که این رویکرد جدید همچنین نسبت به مدل تولید تصویر DALL-E 3 متعلق به OpenAI که در سپتامبر 2023 عرضه شد نیز بهبود قابلتوجهی در زمینه تولید تصویر دارد.
نکته قابلتوجه اینکه مدل هوش مصنوعی GPT-4o در اختیار تمام کاربران شامل کاربران سرویس رایگان و پولی این شرکت قرار میگیرد. قابلیتهای متن و تصویر این مدل هماکنون برای همه کاربران عرضه شده است، اما قابلیت جدید Voice Mode آن ابتدا بهصورت آلفا از هفتههای آینده برای کاربران ChatGPT Plus در دسترس قرار خواهد گرفت، و بعد به مرحله انتشار گستردهتر میرود.
پاسخ ها