آزمایشهای انجامشده نشان میدهد که o1 عادت دارد پاسخهای طولانی تولید کند که شاید برای سؤالهای ساده چندان مناسب نباشد.
OpenAI روز گذشته o1، اولین مدل هوش مصنوعی خود با قابلیت استدلال را منتشر کرد. نکته قابلتوجهی که درباره این مدل وجود دارد، مکث کوتاه آن برای «فکر کردن» در هنگام ارائه پاسخ موردنیاز کاربران است. حالا اولین نگاهها به این مدل موردانتظار و جذاب منتشر شده است.
o1 در مقایسه با GPT-4o برتریها و ضعفهای خاص خود را دارد. OpenAI میگوید که o1 در استدلال و پاسخدادن به سؤالات پیچیده برتری دارد، اما استفاده از آن تقریباً چهار برابر گرانتر از GPT-4o است. همچنین مدل جدید OpenAI ابزارها (نظیر ویژگی تجزیهوتحلیل داده و آپلود فایل)، قابلیتهای چندوجهی و سرعتی که باعث محبوبیت GPT-4o شده را ندارد.
حتی در وبسایت OpenAI نوشتهشده که «GPT-4o همچنان بهترین گزینه برای اکثر درخواستها است» و o1 در انجام وظایف ساده ضعف دارد.
«کیان کتانفروش»، مدیرعامل ایرانیالاصل Workera و استاد دانشگاه استنفورد که یادگیری ماشین تدریس میکند، ازجمله کارشناسانی است که درباره o1 به تککرانچ میگوید:
«هیجان زیادی در جامعه هوش مصنوعی وجود دارد. اگر بتوانید یک الگوریتم یادگیری تقویتی را در ترکیب با برخی از تکنیکهای مدل زبانی که OpenAI دارد آموزش دهید، از نظر فنی میتوانید تفکر گامبهگام ایجاد کنید و به مدل هوش مصنوعی اجازه دهید از ایدههای بزرگی که میخواهید روی آنها کار کنید بهصورت معکوس پیش برود.»
در یک مثال، از هوش مصنوعی o1 خواسته شد تا در برنامهریزی مهمانی خانوادگی روز شکرگزاری به کاربر کمک کند و سؤالاتی از جمله درباره کافیبودن دو اجاق گاز برای پخت شام 11 نفر و نیاز به اجاره اجاق سوم از آن پرسیده شد.
پس از 12 ثانیه «فکرکردن»، o1 یک پاسخ بیشتر از 750 کلمهای نوشت که در آن به کاربر گفته شده دو اجاق گاز کافی است و در هزینههای شما صرفهجویی میکند.
همچنین در مثال دیگری از o1 خواسته شد تا برای یک روز کاری شلوغ که شامل جلسات متعدد و سفر میشود، برنامهریزی کند. هوش مصنوعی OpenAI برای این درخواست یک برنامه بسیار دقیق ارائه کرده که البته خروجی آن ظاهراً بسیار بزرگ بوده است.
بهطورکلی، ظاهراً o1 عادت دارد که برای حتی سادهترین سؤالها نیز پاسخهای طولانی تولید کند. زمانی که از این هوش مصنوعی سوال شد که در کدام منطقه آمریکا میتوان درخت سرو پیدا کرد، o1 پاسخی بیشتر از 800 کلمهای تولید کرد که تمام گونههای سرو کشور و نام علمی آن را شامل میشد.
بنابراین اگر بهدنبال پاسخهای مستقیم و کوتاه هستید، GPT-4o در این زمینه بهتر عمل میکند. از سویی توجه داشته باشید که o1 یک مدل پرهزینه است، بنابراین کاربران باید در استفاده از آن دقت بیشتری داشته باشند و برای سؤالات ساده هزینه بیشتری پرداخت نکنند. همچنین برخی کارشناسان o1 را کمتر تصمیمگیرنده و بیشتر ابزاری برای زیر سؤالبردن تفکر شما در مورد تصمیمات بزرگ میدانند.
پاسخ ها