علی روحانی؛ برنامه نویس وب

علی روحانی؛ برنامه نویس وب

هر چه درباره برنامه نویسی و ماشین و گیمینگ بخونم و برام جالب باشه، اینجام می نویسمش
توسط ۱ نفر دنبال می شود

Project Genie معرفی شد هوش مصنوعی گوگل که متنی، جهان‌های دستوری می‌سازد

Project Genie معرفی شد؛ هوش مصنوعی گوگل که دستورات متنی، جهان‌های تعاملی می‌سازد [تماشا کنید]

این مدل نوآورانه محیط‌های متنوع و تعاملی را شبیه‌سازی می‌کند.

گوگل با معرفی Project Genie، گام بلند دیگری در مسیر دستیابی به هوش جامع مصنوعی (AGI) برداشته است. این ابزار مبتنی‌بر هوش مصنوعی که در دسترس کاربران دارای اشتراک AI Ultra در آمریکا قرار گرفته، به کاربران اجازه می‌دهد تنها با نوشتن چند خط متن، جهان‌های تعاملی و قابل تجربه خلق کنند.

Genie 3 در واقع یک «مدل جهانی» (World Model) همه‌منظوره است که محیط‌های متنوع و تعاملی را شبیه‌سازی می‌کند. برخلاف مدل‌های قبلی گوگل دیپ‌مایند که برای محیط‌های خاصی مثل شطرنج یا بازی Go طراحی شده بودند، این مدل برای درک تنوع دنیای واقعی و پیش‌بینی نحوه تکامل محیط براساس کنش‌های کاربر ساخته شده است.

ساخت جهان‌های تعاملی با ابزار هوش مصنوعی جدید گوگل

در این نمونه اولیه تحقیقاتی، شما ابتدا محیط موردنظر خود را توصیف می‌کنید؛ مثلاً مشخص می‌کنید که قصد دارید جهان را چگونه کاوش کنید (پیاده، پرواز، رانندگی یا…) و زاویه دید شما اول‌شخص یا سوم‌شخص باشد.

پس از تعیین شخصیت (انسان، حیوان یا حتی یک شیء)، مدل Nano Banana Pro تصویری پیش‌فرض یا همان طرح اولیه جهان شما را ارائه می‌کند. این ویژگی به شما اجازه می‌دهد پیش از ورود کامل به دنیای ساخته شده، ظاهر آن را بررسی و در صورت نیاز ویرایش کنید. پس از تأیید، با انتخاب دکمه Create world وارد یک تجربه 60 ثانیه‌ای می‌شوید.

جهان‌های ساخته شده با کیفیت 720p و نرخ فریم 20 تا 24 فریم‌برثانیه اجرا می‌شوند. نکته خیره‌کننده اینکه با حرکت شما، Genie 3 مسیرهای بعدی را به‌صورت لحظه‌ای و براساس اقدامات شما خلق می‌کند.

Project Genie همچنین قابلیتی به نام Remix Worlds دارد که به کاربران اجازه می‌دهد جهان‌های موجود یا آثار دیگران در گالری را برداشته و با تغییر دستورات (Prompts)، نسخه‌ای جدید از آنها تولید کنند. همچنین امکان دانلود ویدیو این جهان‌ها وجود دارد.

گوگل برای نمایش قدرت این مدل، چند ویدیو منتشر کرده که براساس دستورات متنی (Prompts) ساخته شده‌اند.

بااین‌حال، گوگل صراحتاً به برخی محدودیت‌های مدل خود اشاره کرده است. ازجمله اینکه محیط‌های تولید شده ممکن است همیشه کاملاً واقع‌گرایانه نباشند یا صددرصد از قوانین فیزیک پیروی نکنند. علاوه‌براین، کنترل شخصیت‌ها گاهی دشوار است یا با تأخیر (Latency) همراه می‌شود و مدت زمان هر جلسه درحال‌حاضر محدود به ۶۰ ثانیه است.

هدف گوگل از عرضه این فناوری، درک بهتر نحوه استفاده کاربران از مدل‌های جهانی در تحقیقات هوش مصنوعی است. اما در مقیاسی بزرگ‌تر، این فناوری بخشی از مأموریت آزمایشگاه گوگل دیپ‌مایند برای رسیدن به AGI است.

در‌حال‌حاضر، دسترسی به این ابزار تنها برای کاربران بالای 18 سال در ایالات متحده که اشتراک پریمیوم گوگل دارند میسر است، اما این شرکت وعده داده که به‌زودی آن را در دسترس افراد بیشتری قرار می‌دهد.

علی روحانی؛ برنامه نویس وب
علی روحانی؛ برنامه نویس وب هر چه درباره برنامه نویسی و ماشین و گیمینگ بخونم و برام جالب باشه، اینجام می نویسمش

شاید خوشتان بیاید

پاسخ ها

نظر خود را درباره این پست بنویسید
منتظر اولین کامنت هستیم!
آیدت: فروش فایل، مقاله نویسی در آیدت، فایل‌های خود را به فروش بگذارید و یا مقالات‌تان را منتشر کنید👋