حمید پیمان فر

حمید پیمان فر

برنامه نویس ارشد در حوزه بازی سازی، ساکن هلند

هشت میلیاردمین عضو گروه مدل زبان درنا آپدیت شد. امکان دریافت ورودی بیشتر و اتصال به سرویس های خارجی

عضو هشت میلیاردی گروه مدل زبانی درنا به‌روز شد؛ امکان دریافت ورودی بیشتر و اتصال به سرویس‌های خارجی

گروه مدل زبانی درنا در آپدیت عضو هشت میلیاردی خود، میزبان بهبود‌ها و قابلیت‌های بسیاری مثل امکان اتصال به سرویس‌های ثالث است.

گروه مدل زبانی درنا در آپدیت عضو هشت میلیاردی خود، میزبان بهبود‌ها و قابلیت‌های بسیاری است که از جمله آنها می‌توان به امکان اتصال به سرویس‌های ثالث و همچنین افزایش طول داده‌های ورودی (Context length) به ۱۲۸ هزار توکن اشاره کرد.

مرکز تحقیقات هوش مصنوعی پارت، چندی پیش باعرضه یک مدل ۸ میلیارد پارامتری از گروه مدل‌های درنا به صورت متن‌باز، یک مدل زبانی بومی و اختصاصی زبان فارسی را در دسترس توسعه‌دهندگان داخلی قرار داد. این مدل زبانی بزرگ در محصولات متنوعی مانند چت‌بات‌ها، دستیارهای هوشمند و دیگر سرویس‌های مبتنی بر هوش مصنوعی کاربرد دارد و برای خلق محتوا، خلاصه‌سازی، ترجمه و... به زبان فارسی مورد استفاده قرار می‌گیرد.

حال این عضو گروه مدل‌های زبانی درنا، میزبان یک به‌روزرسانی است که عملکرد آن را بهبود می‌بخشد. برای نخستین‌بار، عضو هشت میلیاردی گروه مدل درنا در نسخه دوم خود توانسته به طول داده‌های ورودی  ۱۲۸ هزار توکنی دست پیدا کند. این در حالی است که نسخه اول تا سقف ۸ هزار توکن از داده‌های ورودی پشتیبانی می‌کرد و در به‌روزرسانی جدید، شاهد بهبود ۱۶ برابری در این زمینه هستیم. به لطف این افزایش ظرفیت، مدل به‌روزرسانی شده درنا می‌تواند به خوبی از عهده چت‌های طولانی بر بیاید و پاسخ باکیفیت‌تری را در جواب پرسش کاربر ارائه کند.

یکی دیگر از تغییرات نسخه جدید مدل زبانی درنا، قابلیت اتصال به APIها و سرویس‌های ثالث است. این قابلیت، دست توسعه‌دهندگان را برای استفاده از امکانات سرویس‌های مختلف باز می‌گذارد و هر محصول می‌تواند به‌صورت مستقیم با ابزارهای خارجی تعامل کند. برای مثال، یک چت‌بات هوشمند مبتنی بر مدل درنا، قادر است با اتصال به API سرویس هواشناسی، اطلاعات لحظه‌ای از آب‌وهوای محلی را در اختیار کاربر قرار بدهد.

انتشار منبع باز عضو جدید گروه مدل زبانی «توکا» با عنوان SBert 

پارت همچنین از متن‌باز شدن عضو جدید گروه مدل زبانی توکا تحت عنوان «اس‌برت» خبر داد. این مدل علی‌رغم حجم پایین خود، عملکرد قابل قبولی در فهم و ارائه محتوا به زبان فارسی دارد و بدون نیاز به سخت‌افزارهای پرهزینه، قابل اجرا و شخصی‌سازی است. کیفیت بالای این مدل، نتیجه فرایند آموزش و استفاده از داده‌های تمیز شده فارسی است که توکا را به مدلی قابل اتکا برای استفاده در زمینه RAGها و چت‌بات‌های پاسخگو به سؤالات محدود و متداول تبدیل می‌کند. انواع مختلف چت‌بات‌ها، فارغ از نوع فعالیت و یا استفاده از مدل‌های داخلی یا خارجی، نیازمند استفاده از این دسته از مدل‌ها هستند. حال توکا این امکان را برای توسعه‌دهندگان شخصی و استارتاپ‌هایی که منابع و سخت‌افزار محدودی دارند، فراهم می‌کند تا به صورت لوکال از این مدل استفاده کنند که در نوع خود بسیار جالب توجه است.

استمرار و تعهد به پیشرفت هر چه بیشتر در حوزه مدل‌های زبانی، هدفی است که مرکز تحقیقات هوش مصنوعی پارت به طور مدام، پیگیری می‌کند. در همین راستا، این مجموعه دانش‌بنیان، طی ماه‌های اخیر با عرضه نسخه دوم LLM هشت میلیاردی درنا و عضو جدید مدل زبانی «توکا» با عنوان «اس‌برت» به صورت متن‌باز، به بخش گسترده‌ای از نیاز اکوسیستم هوش مصنوعی کشور برای دسترسی به مدل‌های پیشرفته و اختصاصی به زبان فارسی پاسخ داده است. این مجموعه برنامه دارد تا همچنان با ارائه سرویس‌های جدید و به‌روزرسانی محصولات موجود، ابزارهایی با توانایی و استانداردهای روز جهان را در دسترس کسب‌وکارها و توسعه‌دهندگان فارسی‌زبان قرار دهد تا در مسیر ساخت محصولات هوش مصنوعی دلخواه خود، با موانعی از جنس عدم وجود ابزارهای مورد نیاز روبه‌رو نشوند.

نسخه دوم عضو هشت میلیاردی گروه مدل زبانی درنا در سنجه Persian LLM Leaderboard پارت در وب‌سایت هاگینگ‌فیس بنچ‌مارک شده و کیفیت عملکرد آن در زمینه‌های مختلف قابل مشاهده و ارزیابی است.

حمید پیمان فر
حمید پیمان فر برنامه نویس ارشد در حوزه بازی سازی، ساکن هلند

شاید خوشتان بیاید

پاسخ ها

نظر خود را درباره این پست بنویسید
منتظر اولین کامنت هستیم!
آیدت: فروش فایل، مقاله نویسی در آیدت، فایل‌های خود را به فروش بگذارید و یا مقالات‌تان را منتشر کنید👋