این معماری برای رسیدن به این سطح از مهارت فقط به هزار نمونه آموزشی نیاز دارد.
استارتاپ هوش مصنوعی Sapient Intelligence که در سنگاپور مستقر است، معماری جدیدی برای هوش مصنوعی توسعه داده است که میتواند در انجام وظایف پیچیده استدلالی با مدلهای زبانی بزرگ (LLM) رقابت کند و در برخی موارد بهطور چشمگیری از آنها پیشی بگیرد.
به گزارش ونچربیت، این معماری که با نام «مدل استدلال سلسلهمراتبی» شناخته میشود با الهام از شیوه عملکرد مغز انسان طراحی شده است. این سیستم روی این موضوع تمرکز کرده که مغز انسان چگونه از سیستمهای متمایز برای برنامهریزی آهسته و آگاهانه در کنار محاسبات سریع و شهودی استفاده میکند.
این مدل با استفاده از حجم کوچکی از دادهها و حافظهای که مدلهای زبانی بزرگ امروزی نیاز دارند، به نتایجی چشمگیر دست مییابد. این کارایی بالا میتواند فواید مهمی برای کاربردهای واقعی هوش مصنوعی در سطح سازمانی داشته باشد؛ بهخصوص در شرایطی که دادهها محدود و منابع محاسباتی کم هستند.
مدلهای زبانی بزرگ در مواجهه با مسائل پیچیده عمدتاً به روش «زنجیره افکار» تکیه میکنند. در این روش، مسئله به گامهای میانی مبتنی بر متن شکسته میشود و مدل عملاً مجبور میشود هنگام حرکت بهسوی راهحل، بلند فکر کند یا بهصورت صریح مراحل ذهنی خود را بیان کند.
محققان سنگاپوری اما در مقاله خود ادعا کردهاند که استفاده از زنجیره افکار (CoT) برای استدلال نه یک راهحل رضایتبخش، بلکه تکیهگاهی موقتی است. این روش متکی به تجزیههای شکننده و از پیشتعریفشده توسط انسان است، جایی که حتی یک اشتباه کوچک یا جابهجایی ترتیب مراحل میتواند کل فرایند استدلال را از ریل خارج کند.
اما برای گذر از این مرحله، پژوهشگران به بررسی مفهوم «استدلال نهفته» پرداختند که در آن، مدل بهجای تولید نشانههای فکری، فرایند استدلال را در قالب بازنماییهای درونی و انتزاعی از مسئله انجام میدهد. این رویکرد با نحوه تفکر انسان هماهنگتر است.
در نهایت محققان توانستهاند معماری جدیدی توسعه دهند که در انجام وظایف استدلالی تا ۱۰۰ برابر از مدلهای فعلی سریعتر است و البته فقط با یک هزار نمونه آموزشی توانسته به این سطح از مهارت و سرعت دست یابد.
پاسخ ها