مدل جدید گوگل همان هوش مصنوعی مرموز Nano-Banana است که عملکردش در ویرایش تصویر، کاربران و کارشناسان را شگفتزده کرده بود.
گوگل از یک ارتقا بزرگ و بسیار قدرتمند برای قابلیت ویرایش تصویر جمینای رونمایی کرد. این بهروزرسانی که مدل پشت پرده آن Nano banana نام دارد، به کاربران کنترل بسیار دقیقتری در زمینه ویرایش تصاویر میدهد و بهطور خاص مشکل بزرگ حفظ ثبات چهره و جزئیات سوژه را در ویرایشهای متوالی حل میکند.
براساس گزارش تککرانچ، مدل جدید گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معرفی رسمی، به صورت ناشناس با نام Nano-Banana در پلتفرم ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد خیرهکنندهاش، کاربران و کارشناسان را شگفتزده کرد. اکنون گوگل تأیید کرده است که این مدل تحسینشده، همان فناوری جدیدی است که درحال اضافهشدن به جمینای است.
تمرکز اصلی این ارتقا روی حل یکی از بزرگترین مشکلات هوش مصنوعی مولد تصویر است: حفظ ثبات شخصیت. از این پس، میتوانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید و مطمئن باشید که چهره و ظاهر آنها در ویرایشهای مختلف (مانند تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی میماند.
علاوهبراین، قابلیتهای پیشرفته دیگری نیز اضافه شده است؛ کاربران میتوانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آنها را در یک صحنه جدید و منسجم ترکیب کند. همچنین میتوانید سبک بصری یک تصویر (مانند الگوی یک گل) را بر روی یک شیء در تصویر دیگر اعمال کنید (مثلاً آن را به طرح یک لباس تبدیل کنید). همچنین کاربران میتوانند به صورت متوالی و مرحله به مرحله، اجزای مختلف یک تصویر را تغییر دهند، بدون اینکه ویرایشهای قبلی از بین برود.
این بهروزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت میگیرد. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست کاربران زیادی را جذب کند، گوگل نیز در تلاش است با ارائه ابزارهای قدرتمندتر، این فاصله را جبران کند. درحالحاضر، ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، درحالیکه جمینای ۴۵۰ میلیون کاربر ماهانه را ثبت کرده است.
گوگل همچنین با درسگرفتن از مشکلات گذشته (مانند تولید تصاویر تاریخی نادرست) تدابیر ایمنی جدیدی را نیز در نظر گرفته است. تمام تصاویر تولید یا ویرایش شده با این ابزار جدید، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوهبراین، قوانین سختگیرانهای برای جلوگیری از تولید محتوای مضر، مانند تصاویر خصوصی، اعمال شده است.
این قابلیتهای جدید به تدریج برای تمام کاربران در اپلیکیشن جمینای و همچنین برای توسعهدهندگان از طریق پلتفرمهای API گوگل در دسترس قرار میگیرد.
پاسخ ها