تکنیک Helix Parallelism به هوش مصنوعی اجازه میدهد تا با همان سرعت قبل به کاربران بیشتری پاسخ دهد.
انویدیا از یک تکنیک موازیسازی به نام «هلیکس پاراللیسم» (Helix Parallelism) پرده برداشته است که به مدلهای هوش مصنوعی اجازه میدهد تا حجم عظیمی از اطلاعات را پردازش کنند و با همان سرعت بهطور همزمان به ۳۲ برابر کاربر بیشتر پاسخ دهند. این فناوری بهطور ویژه برای معماری پردازشگرهای گرافیکی جدید بلکول (Blackwell) طراحی شده است.
با بزرگتر و پیچیدهتر شدن مدلهای هوش مصنوعی، یکی از مهمترین مسائل آنها توانایی پردازش حجم عظیمی از اطلاعات زمینه (Context) در هنگام تولید پاسخهای آنی است. اکنون انویدیا با معرفی Helix Parallelism راهحلی برای این مشکل ارائه کرده است.
مدلهای زبان بزرگ برای تولید هر کلمه جدید، با دو چالش اساسی روبهرو هستند:
فناوری هلیکس با یک رویکرد هوشمندانه، این دو فرایند را از هم جدا و به صورت بهینه مدیریت میکند:
این فرایند پیچیده با استفاده از فناوریهای اتصال پرسرعت انویدیا مانند NVLink و NVL72 و همچنین تکنیکی به نام HOP-B ممکن شده است.
نتایج شبیهسازیها با یک مدل زبانی بزرگ، عملکرد فوقالعاده این فناوری را به اثبات رسانده است؛ هلیکس میتواند با حفظ همان سرعت و تأخیر، به ۳۲ برابر کاربر بیشتر بهصورت همزمان سرویس بدهد. همچنین در شرایط بار کاری کمتر، زمان پاسخگویی (تأخیر بین تولید هر کلمه) تا ۱.۵ برابر کاهش مییابد.
این پیشرفت به این معناست که دستیارهای مجازی و چتباتهای هوش مصنوعی اکنون میتوانند میلیونها کلمه اطلاعات را بهصورت آنی پردازش کنند و درعینحال، پاسخگویی و سرعت خود را در تعامل با کاربر حفظ کنند.
پاسخ ها