مهندس کوچولو

مهندس کوچولو

یه مهندس خسته که مهندس کوچولوی درونش زنده است و دایم داره میچرخه دنبال چیزای جالب و جدید
توسط ۴ نفر دنبال می شود
 ۲ نفر را دنبال می کند

انویدیا از مدل‌های Nemotron 3 برای ساخت عوامل هوش مصنوعی رونمایی کرد

انویدیا از مدل‌های Nemotron 3 برای ساخت ایجنت‌های هوش مصنوعی رونمایی کرد

انویدیا از سه مدل هوش مصنوعی Nemotron 3 با معماری ترکیبی رونمایی کرد که برای ساخت ایجنت‌های هوش مصنوعی کاربرد دارند.

انویدیا از نسخه جدید مدل‌های هوش مصنوعی خود به نام Nemotron 3 رونمایی کرد. این خانواده جدید با هدف افزایش دقت در ساخت ایجنت‌های هوش مصنوعی طراحی شده است. در ادامه مشخصات این مدل‌ها را می‌خوانید.

انویدیا برای پوشش‌دادن نیازهای مختلف این مدل‌ها را در سه سایز متفاوت منتشر کرده است:

  1. Nemotron 3 Nano (۳۰ میلیارد پارامتر): مدلی کارآمد برای انجام کارهای خاص و هدفمند با سرعت بالا.
  2. Nemotron 3 Super (۱۰۰ میلیارد پارامتر): مدل میانی که برای برنامه‌های چند-ایجنتی طراحی شده و قدرت استدلال بالایی دارد.
  3. Nemotron 3 Ultra (۵۰۰ میلیارد پارامتر): این مدل با موتور استدلال قدرتمند خود برای حل پیچیده‌ترین مسائل سازمانی ساخته شده است.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

کارایی بالای این مدل‌ها به‌خاطر معماری ترکیبی آنهاست. انویدیا به‌جای استفاده صرف از معماری ترنسفورمر (که در مدل‌هایی مثل GPT استفاده می‌شود) آن را با معماری Mamba ترکیب کرده است. این ترکیب باعث می‌شود برخلاف مدل‌های قدیمی که برای هر کلمه نیاز به حافظه زیادی داشتند، این مدل‌ها بسیار سبک‌تر اجرا شوند. همچنین طبق ادعای انویدیا، مدل نانو جدید تا ۴ برابر خروجی توکن سریع‌تری نسبت به نسل قبل دارد و هزینه‌های استنتاج را تا ۶۰ درصد کاهش می‌دهد.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

برای مدل‌های بزرگ‌تر سوپر و اولترا، انویدیا از یک ترفند به نام «MoE هیبریدی» استفاده کرده است. «کاری بریسکی» (Kari Briski)، معاون نرم‌افزار انویدیا، این مفهوم را اینگونه تشبیه می‌کند: «تصور کنید چندین آشپز ماهر در یک آشپزخانه بزرگ کار می‌کنند. آنها همگی از یک هسته مشترک (مواد اولیه و اجاق‌ها) استفاده می‌کنند، اما هرکدام قفسه ادویه مخصوص خود را دارند.» این روش باعث می‌شود مدل‌ها مقیاس‌پذیرتر باشند و بدون افت دقت روی زیرساخت‌های فعلی اجرا شوند.

انویدیا می‌داند که مدل خام به‌تنهایی کافی نیست. به همین دلیل محیطی شبیه‌سازی‌شده به نام NeMo Gym را راه‌اندازی کرده است. این فضا شبیه یک باشگاه بدنسازی برای هوش مصنوعی است. توسعه‌دهندگان می‌توانند ایجنت‌های خود را در این محیط‌های شبیه‌سازی‌شده رها کنند تا با آزمون و خطا ورزیده شوند و عملکردشان را قبل از ورود به دنیای واقعی محک بزنند.

مدل Nemotron 3 Nano از امروز روی Hugging Face و همچنین از طریق پلتفرم‌های مختلف مانند FriendliAI و OpenRouter در دسترس است.

مهندس کوچولو
مهندس کوچولو یه مهندس خسته که مهندس کوچولوی درونش زنده است و دایم داره میچرخه دنبال چیزای جالب و جدید

شاید خوشتان بیاید

پاسخ ها

نظر خود را درباره این پست بنویسید
منتظر اولین کامنت هستیم!
آیدت: فروش فایل، مقاله نویسی در آیدت، فایل‌های خود را به فروش بگذارید و یا مقالات‌تان را منتشر کنید👋