توسعه دهنده شاد

توسعه دهنده شاد

مثلِ خیلی از برنامه نویسا، ماشین تبدیل کافئین به کد هستم، علاقمند به هوش مصنوعی و همه ابزارها، گجت ها و نوآوری های جدید
توسط ۳ نفر دنبال می شود

۳۰ ریاضیدان برجسته از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت زده شدند

۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند

۳۰ نفر از برجسته‌ترین ریاضیدانان جهان توانایی‌های مدل پیشرفته ChatGPT را در حل مسائل دشوار ارزیابی کردند.

در یک گردهمایی در کالیفرنیا، ۳۰ نفر از برجسته‌ترین ریاضیدانان جهان در یک رویارویی مستقیم، توانایی‌های مدل پیشرفته هوش مصنوعی را در حل مسائل دشوار ارزیابی کردند. نتیجه باعث شگفتی و تحسین این افراد شد: مدل استدلال‌گر ChatGPT توانست مسائل بسیار پیچیده در سطح دکترا را حل کند.

براساس گزارش لایو ساینس، در اواسط ماه مه امسال یک رویداد علمی منحصربه‌فرد و محرمانه برگزار شد. ۳۰ نفر از نوابغ ریاضی جهان از سراسر دنیا جمع شدند تا در یک آزمون دو روزه توانایی‌های مدل استدلال‌گر o4-mini شرکت OpenAI را بسنجند. هدف طرح مسائلی بود که حتی برای یک ریاضیدان حرفه‌ای نیز چالش‌برانگیز باشد.

مسائل ریاضی دشوار برای ChatGPT

این رویارویی بخشی از یک پروژه بنچمارک به نام FrontierMath بود که توسط سازمان غیرانتفاعی Epoch AI و به سفارش OpenAI اجرا می‌شد. هدف ارزیابی توانایی واقعی هوش مصنوعی در استدلال و حل مسائلی بود که راه‌حل آنها پیشتر در اینترنت منتشر نشده و مدل نمی‌توانست صرفاً با جستجو به پاسخ برسد. برای جلوگیری از هرگونه تقلب ناخواسته، تمام ارتباطات میان ریاضیدانان شرکت‌کننده از طریق اپلیکیشن امن سیگنال انجام می‌شد و آنها متعهد به عدم افشای اطلاعات بودند.

chatGPT ریاضیدان

در ابتدا، ریاضیدانان با طرح مسائل پیچیده، در به چالش‌کشیدن هوش مصنوعی موفق بودند. برای هر مسئله‌ای که چت‌بات قادر به حل آن نبود، طراح سؤال یک جایزه ۷ هزار و ۵۰۰ دلاری دریافت می‌کرد. اما اوضاع تغییر کرد.

«کن اونو» (Ken Ono)، ریاضیدان سرشناس از دانشگاه ویرجینیا و یکی از داوران این رویداد، روایت می‌کند که چگونه ابتدا از عملکرد بات ناامید شده بود. اما او یک مسئله حل‌نشده در «نظریه اعداد» را که در سطح دکترا بود، برای چت‌بات مطرح کرد. اتفاقی که در ۱۰ دقیقه بعد رخ داد، همه را شگفت‌زده کرد:

ربات ابتدا دو دقیقه را صرف یافتن و تسلط بر تمام مقالات علمی مرتبط با آن حوزه کرد. سپس روی صفحه نوشت که برای یادگیری، ابتدا قصد دارد یک نسخه ساده‌تر از همان مسئله را حل کند. چند دقیقه بعد اعلام کرد که اکنون آماده حل مسئله اصلی و دشوارتر است. پنج دقیقه پس از آن، o4-mini یک راه‌حل کاملاً صحیح و در عین حال، به گفته پروفسور اونو، «گستاخانه» ارائه داد. این هوش مصنوعی در آخر جوابش گفت: «نیازی نیست به جایی استناد کنم، چون این مسئله را خودم حل کردم.»

پروفسور اونو می‌گوید: «من همکارانی دارم که به معنای واقعی کلمه گفتند این مدل‌ها دارند به سطح نبوغ ریاضی نزدیک می‌شوند.»

مدل o4-mini، برخلاف مدل‌های زبانی بزرگ معمولی که صرفاً به دنبال پیش‌بینی کلمه بعدی هستند، یک LLM استدلال‌گر است. این مدل‌ها بر روی مجموعه داده‌های تخصصی و با بازخورد انسانی بسیار قوی‌تر آموزش می‌بینند. این رویکرد به آنها اجازه می‌دهد تا به‌جای تکرار اطلاعات، به درک عمیق‌تری از مسائل پیچیده دست یابند و فرایند استدلال خود را مرحله به مرحله نمایش دهند.

توسعه دهنده شاد
توسعه دهنده شاد مثلِ خیلی از برنامه نویسا، ماشین تبدیل کافئین به کد هستم، علاقمند به هوش مصنوعی و همه ابزارها، گجت ها و نوآوری های جدید

شاید خوشتان بیاید

پاسخ ها

نظر خود را درباره این پست بنویسید
منتظر اولین کامنت هستیم!
آیدت: فروش فایل، مقاله نویسی در آیدت، فایل‌های خود را به فروش بگذارید و یا مقالات‌تان را منتشر کنید👋