علی روحانی؛ برنامه نویس وب

علی روحانی؛ برنامه نویس وب

هر چه درباره برنامه نویسی و ماشین و گیمینگ بخونم و برام جالب باشه، اینجام می نویسمش
توسط ۱ نفر دنبال می شود

رقیب جدید Nano Banana Pro معرفی شد؛ Qwen-Image-2512 تصاویر با کیفیت بالا را به صورت رایگان ایجاد می‌کند

رقیب جدید Nano Banana Pro معرفی شد؛ Qwen-Image-2512 رایگان تصاویر باکیفیت می‌سازد

عملکرد این مدل در تولید چهره و جزئیات مختلف و تولید متن و چیدمان ساختاریافته بهبود یافته است.

مدل هوش مصنوعی Nano Banana Pro گوگل چند ماه قبل معرفی شد و در زمینه تولید تصویر بسیاری از خواسته‌های کاربران را برآورده می‌کند. اما این مدل عمیقاً به زیرساخت ابری گوگل متصل شده و برای موارد حرفه‌ای، استفاده از آن هزینه‌ زیادی برای مشتریان دارد. حالا تیم Qwen از علی‌بابا، با معرفی Qwen-Image-2512 تلاش کرده تا چنین سرویسی را به‌صورت رایگان در اختیار کاربران قرار دهد.

Qwen-Image-2512 مدل هوش مصنوعی برای توسعه‌دهندگان و حتی شرکت‌های بزرگ است که به‌صورت رایگان و تجاری تحت لایسنس آزاد Apache 2.0 ساخته شده. این مدل هم‌اکنون از طریق رابط Qwen Chat در دسترس قرار گرفته و نسخه‌های متفاوت آن در Hugging Face و ModelScope منتشر شده است.

برای آزمایش بدون نیاز به نصب این مدل، یک دموی رایگان در Hugging Face و نسخه مرورگری ModelScope نیز قابل دسترس است و کسب‌وکارهایی که ترجیح می‌دهند از سرویس مدیریت‌شده استفاده کنند، می‌توانند از طریق Model Studio در علی‌بابا کلاد به آن دسترسی پیدا کنند.

Qwen-Image-2512 در چه زمینه‌هایی بهبود پیدا کرده است؟

مدل Qwen-Image-2512 بر سه محور اصلی تمرکز دارد که برای سازمان‌ها می‌توانند مهم باشند.

  • واقع‌گرایی چهره و انسجام محیطی: مدل، جلوه «ظاهر مصنوعی» که در اکثر مدل‌ها دیده می‌شود را کاهش می‌دهد. جزئیات سن، بافت پوست و حالات چهره با این مدل طبیعی‌تر نمایش داده می‌شوند و محیط‌های پس‌زمینه با معنا و ارتباط بصری روشن‌تری رندر می‌شوند. Qwen می‌گوید که برای شبیه‌سازی، آموزش داخلی و ارتباطات سازمانی، این سطح از تولید طبیعی بسیار مهم است.
بهبود ساخت چهره در Qwen-Image-2512
  • وفاداری بافت‌ها و مواد: مناظر، آب، مو و سطوح مواد با جزئیات بیشتری نمایش داده می‌شوند. این موضوع نه‌تنها از نظر زیباشناسی اهمیت دارد، بلکه هزینه‌های مربوط به مدل را کاهش می‌دهد.
  • متن و چیدمان ساختاریافته: درست مانند نانو بنانا پرو، دقت این مدل در تولید متن داخل تصویر و انسجام چیدمان بهبود یافته و حالا اسلایدها، پوسترها و اینفوگرافیک‌ها خواناتر و دقیق‌تر از قبل هستند.

در تست‌های انجام شده روی AI Arena علی‌بابا، Qwen-Image-2512 به‌عنوان قدرتمندترین مدل متن‌باز تصویر رتبه‌بندی شده و در رقابت با سیستم‌های بسته نیز عملکرد نزدیکی داشته است.

رتبه‌بندی مدل‌ها در Alibaba AI Arena

حوزه‌ای که Qwen-Image-2512 بیش از هر چیز دیگری خود را در آن متمایز می‌داند، در «مجوز و شیوه انتشار» است. این مدل تحت لایسنس Apache 2.0 عرضه شده؛ یعنی سازمان‌ها و توسعه‌دهندگان می‌توانند آزادانه از آن استفاده کنند، کد و وزن‌ها را تغییر دهند، آن را برای موارد خاص خود تنظیم کنند و حتی بدون محدودیت حقوقی، به‌صورت تجاری آن را مستقر کنند.

علی روحانی؛ برنامه نویس وب
علی روحانی؛ برنامه نویس وب هر چه درباره برنامه نویسی و ماشین و گیمینگ بخونم و برام جالب باشه، اینجام می نویسمش

شاید خوشتان بیاید

پاسخ ها

نظر خود را درباره این پست بنویسید
منتظر اولین کامنت هستیم!
آیدت: فروش فایل، مقاله نویسی در آیدت، فایل‌های خود را به فروش بگذارید و یا مقالات‌تان را منتشر کنید👋