ابتدا به مدل OpenAI o1 نگاه کنید. هوش مصنوعی که وسواس دارد

اولین نگاه به مدل OpenAI o1؛ هوش مصنوعی که دارای وسواس فکری است

آزمایش‌های انجام‌شده نشان می‌دهد که o1 عادت دارد پاسخ‌های طولانی تولید کند که شاید برای سؤال‌های ساده چندان مناسب نباشد.

OpenAI روز گذشته o1، اولین مدل هوش مصنوعی خود با قابلیت استدلال را منتشر کرد. نکته قابل‌توجهی که درباره این مدل وجود دارد، مکث کوتاه آن برای «فکر کردن» در هنگام ارائه پاسخ موردنیاز کاربران است. حالا اولین نگاه‌ها به این مدل موردانتظار و جذاب منتشر شده است.

o1 در مقایسه با GPT-4o برتری‌ها و ضعف‌های خاص خود را دارد. OpenAI می‌گوید که o1 در استدلال و پاسخ‌دادن به سؤالات پیچیده برتری دارد، اما استفاده از آن تقریباً چهار برابر گران‌تر از GPT-4o است. همچنین مدل جدید OpenAI ابزارها (نظیر ویژگی تجزیه‌وتحلیل داده و آپلود فایل)، قابلیت‌های چندوجهی و سرعتی که باعث محبوبیت GPT-4o شده را ندارد.

حتی در وب‌سایت OpenAI نوشته‌شده که «GPT-4o همچنان بهترین گزینه برای اکثر درخواست‌ها است» و o1 در انجام وظایف ساده ضعف دارد.

«کیان کتان‌فروش»، مدیرعامل ایرانی‌الاصل Workera و استاد دانشگاه استنفورد که یادگیری ماشین تدریس می‌کند، ازجمله کارشناسانی است که درباره o1 به تک‌کرانچ می‌گوید:

«هیجان زیادی در جامعه هوش مصنوعی وجود دارد. اگر بتوانید یک الگوریتم یادگیری تقویتی را در ترکیب با برخی از تکنیک‌های مدل زبانی که OpenAI دارد آموزش دهید، از نظر فنی می‌توانید تفکر گام‌به‌گام ایجاد کنید و به مدل هوش مصنوعی اجازه دهید از ایده‌های بزرگی که می‌خواهید روی آن‌ها کار کنید به‌صورت معکوس پیش برود.»

چند مثال از تجربه کار با هوش مصنوعی o1

در یک مثال، از هوش مصنوعی o1 خواسته شد تا در برنامه‌ریزی مهمانی خانوادگی روز شکرگزاری به کاربر کمک کند و سؤالاتی از جمله درباره کافی‌بودن دو اجاق گاز برای پخت شام 11 نفر و نیاز به اجاره اجاق سوم از آن پرسیده شد.

پس از 12 ثانیه «فکرکردن»، o1 یک پاسخ بیشتر از 750 کلمه‌ای نوشت که در آن به کاربر گفته شده دو اجاق گاز کافی است و در هزینه‌های شما صرفه‌جویی می‌کند.

همچنین در مثال دیگری از o1 خواسته شد تا برای یک روز کاری شلوغ که شامل جلسات متعدد و سفر می‌شود، برنامه‌ریزی کند. هوش مصنوعی OpenAI برای این درخواست یک برنامه بسیار دقیق ارائه کرده که البته خروجی آن ظاهراً بسیار بزرگ بوده است.

به‌طورکلی، ظاهراً o1 عادت دارد که برای حتی ساده‌ترین سؤال‌ها نیز پاسخ‌های طولانی تولید کند. زمانی که از این هوش مصنوعی سوال شد که در کدام منطقه آمریکا می‌توان درخت سرو پیدا کرد، o1 پاسخی بیشتر از 800 کلمه‌ای تولید کرد که تمام گونه‌های سرو کشور و نام علمی آن را شامل می‌شد.

بنابراین اگر به‌دنبال پاسخ‌های مستقیم و کوتاه هستید، GPT-4o در این زمینه بهتر عمل می‌کند. از سویی توجه داشته باشید که o1 یک مدل پرهزینه است، بنابراین کاربران باید در استفاده از آن دقت بیشتری داشته باشند و برای سؤالات ساده‌ هزینه بیشتری پرداخت نکنند. همچنین برخی کارشناسان o1 را کمتر تصمیم‌گیرنده و بیشتر ابزاری برای زیر سؤال‌بردن تفکر شما در مورد تصمیمات بزرگ می‌دانند.