جدیدترین هوش مصنوعی«دیپ مایند» با نام «MuZero» میتواند قدرتمندتر از برنامههای قبلی و بدون نیاز به آموزش دیدن و با روشهایی نزدیک به روش تصمیم گیری انسانها در بازیهایی مانند شطرنج، گیم و گو به راحتی قهرمان شود.
MuZero جدیدترین هوش مصنوعی است که توسط دیپ مایند توسعه یافته و میتواند بدون اینکه اطلاعاتی از قوانین بازی بداند، در بازیهای مختلف مهارت خوبی از خود نشان دهد. اولین نسخه این برنامه در سال 2019 برای بازیهای مختلف گیم و شطرنج و ... مورد بررسی قرار گرفت.
«آلفاگو» نخستین هوش مصنوعی بود که توسط دیپ مایند برای بازی «گو» توسعه یافت. آلفاگو با الگوریتم جستجوی درختی موسوم به مونت کارلو حرکات را براساس اطلاعات قبلی خود یاد میگیرد.
سپس دیپ مایند، «آلفاگو زیرو» را توسعه داد که توانست در کمتر از یک روز به قهرمان شطرنج تبدیل شود. آلفاگو زیرو بعد از هر اشتباه در بازی بعدی، حرکات اصلاحی در پیش میگیرد و به شکلی خود را آموزش میدهد. این رفتار هوش مصنوعی آلفا گو از مغز انسان الگوبرداری شده و توانایی پردازش خوبی دارد.
اکنون جدیدترین هوش مصنوعی دیپمایند با نام MuZero، میتواند به سرعت و با روش خود آموزی و بدون نیاز به آموزش، تسلط خوبی به قواعد بازیهای شطرنج، شوگی و گیم پیدا کرده و تواناییهای خوبی از خود به نمایش بگذارد.
ایجاد الگوریتمی که بتواند خود را با شرایط مختلف انطباق دهد، چالشی است که محققان هوش مصنوعی در تلاش هستند آن را حل کنند. در بازیهایی مانند شطرنج، نحوه بازی حریف میتواند در تعیین استراتژی بازی موثر باشد. هوش مصنوعی جدید دیپمایند سعی میکند با استفاده از روشی به نام lookahead، سعی میکند چندین حرکت را در بازی از قبل برنامه ریزی کرده و حالتهای احتمالی که ممکن است در آینده پیش بیاید را پیشبینی کند.
در موقعیتهای واقعی بازی، قوانین سادهای وجود دارند که قابل آموزش دادن نیستند و در حین بازی ممکن است طرفین از چنین رویکردهایی استفاده کنند. محققان در تلاش هستند هوش مصنوعی رفتار و عملکردی نزدیک به بازی واقعی و حتی قدرتمندتر از آن از خود نشان دهد. اما پیاده سازی چنین رویکردهایی گاهی آنقدر پیچیده میشود که تقریبا کار را به مرز غیرممکن شدن میرساند.
هوش مصنوعی MuZero به جای مدلسازی کل محیط، تنها مولفههای مهم را نیز در تصمیم گیریهای خود مورد توجه قرار میدهد. این روش هوش مصنوعی جدید دیپ مایند شباهت زیادی به روش تصمیم گیری انسان دارد. به علاوه، بررسیها نشان میدهد MuZero هر چقدر زمان بیشتری برای تحلیل و بررسی صرف کند، بهتر میتواند تصمیم گیری کند.
پاسخ ها