![Project Genie معرفی شد؛ هوش مصنوعی گوگل که دستورات متنی، جهانهای تعاملی میسازد [تماشا کنید]](../upload/attach/15143/google_project_genie_910x600_0.webp)
این مدل نوآورانه محیطهای متنوع و تعاملی را شبیهسازی میکند.
گوگل با معرفی Project Genie، گام بلند دیگری در مسیر دستیابی به هوش جامع مصنوعی (AGI) برداشته است. این ابزار مبتنیبر هوش مصنوعی که در دسترس کاربران دارای اشتراک AI Ultra در آمریکا قرار گرفته، به کاربران اجازه میدهد تنها با نوشتن چند خط متن، جهانهای تعاملی و قابل تجربه خلق کنند.
Genie 3 در واقع یک «مدل جهانی» (World Model) همهمنظوره است که محیطهای متنوع و تعاملی را شبیهسازی میکند. برخلاف مدلهای قبلی گوگل دیپمایند که برای محیطهای خاصی مثل شطرنج یا بازی Go طراحی شده بودند، این مدل برای درک تنوع دنیای واقعی و پیشبینی نحوه تکامل محیط براساس کنشهای کاربر ساخته شده است.
در این نمونه اولیه تحقیقاتی، شما ابتدا محیط موردنظر خود را توصیف میکنید؛ مثلاً مشخص میکنید که قصد دارید جهان را چگونه کاوش کنید (پیاده، پرواز، رانندگی یا…) و زاویه دید شما اولشخص یا سومشخص باشد.
پس از تعیین شخصیت (انسان، حیوان یا حتی یک شیء)، مدل Nano Banana Pro تصویری پیشفرض یا همان طرح اولیه جهان شما را ارائه میکند. این ویژگی به شما اجازه میدهد پیش از ورود کامل به دنیای ساخته شده، ظاهر آن را بررسی و در صورت نیاز ویرایش کنید. پس از تأیید، با انتخاب دکمه Create world وارد یک تجربه 60 ثانیهای میشوید.
جهانهای ساخته شده با کیفیت 720p و نرخ فریم 20 تا 24 فریمبرثانیه اجرا میشوند. نکته خیرهکننده اینکه با حرکت شما، Genie 3 مسیرهای بعدی را بهصورت لحظهای و براساس اقدامات شما خلق میکند.
Project Genie همچنین قابلیتی به نام Remix Worlds دارد که به کاربران اجازه میدهد جهانهای موجود یا آثار دیگران در گالری را برداشته و با تغییر دستورات (Prompts)، نسخهای جدید از آنها تولید کنند. همچنین امکان دانلود ویدیو این جهانها وجود دارد.
گوگل برای نمایش قدرت این مدل، چند ویدیو منتشر کرده که براساس دستورات متنی (Prompts) ساخته شدهاند.
بااینحال، گوگل صراحتاً به برخی محدودیتهای مدل خود اشاره کرده است. ازجمله اینکه محیطهای تولید شده ممکن است همیشه کاملاً واقعگرایانه نباشند یا صددرصد از قوانین فیزیک پیروی نکنند. علاوهبراین، کنترل شخصیتها گاهی دشوار است یا با تأخیر (Latency) همراه میشود و مدت زمان هر جلسه درحالحاضر محدود به ۶۰ ثانیه است.
هدف گوگل از عرضه این فناوری، درک بهتر نحوه استفاده کاربران از مدلهای جهانی در تحقیقات هوش مصنوعی است. اما در مقیاسی بزرگتر، این فناوری بخشی از مأموریت آزمایشگاه گوگل دیپمایند برای رسیدن به AGI است.
درحالحاضر، دسترسی به این ابزار تنها برای کاربران بالای 18 سال در ایالات متحده که اشتراک پریمیوم گوگل دارند میسر است، اما این شرکت وعده داده که بهزودی آن را در دسترس افراد بیشتری قرار میدهد.
پاسخ ها