این مدل در زمینههایی ازجمله رندرگرفتن از متن و سرعت تولید ویدیو پیشرفت زیادی کرده است.
استارتاپ آمریکایی Luma AI نسخه جدید مدل هوش مصنوعی تولید ویدیوی خود با نام Dream Machine 1.5 را منتشر کرد که با پیشرفتهای قابلتوجهی در زمینه تولید ویدیو با هوش مصنوعی همراه است.
حساب Luma AI در شبکه اجتماعی ایکس با انتشار ویدیو زیر، برای معرفی مدل تولید ویدیو خود نوشت:
«Dream Machine 1.5 با قابلیت تبدیل متن به ویدیو با کیفیت بالاتر، درک هوشمندانهتر درخواستهای شما، رندر متن سفارشی و بهبود در تبدیل تصویر به ویدیو منتشر شده است!»
براساس گزارشهای منتشرشده، یکی از برجستهترین پیشرفتهای این مدل توانایی آن در رندرگرفتن از متنهای داخل ویدیوهاست، این قابلیت از گذشته بسیاری از مدلهای هوش مصنوعی را به چالش کشیده است. این پیشرفت برای تولید سکانسهای دارای عنوان، لوگوهای متحرک و عناصر گرافیکی روی صفحه، امکانات جدیدی فراهم میکند.
یکی از کاربران نمونههایی از قابلیتهای این مدل را در شبکه اجتماعی ایکس به اشتراک گذاشته است. در یکی از این ویدیوها که مهارت Dream Machine 1.5 در تولید جلوههای بصری پیچیده را نشان میدهد، مدل یک «متن سهبعدی» متحرک از کلمه «LUMA» با افکت «مایع» تولید میکند.
همچنین ظاهراً Dream Machine 1.5 توانایی زیادی در تولید ویدیو با درخواستهای غیرانگلیسی دارد. همین کاربر در مثال دیگری، از زبان عربی برای تولید ویدیوی زیر استفاده کرده است.
علاوهبر این موارد، نسخه جدید این مدل از نظر سرعت نیز بهبود قابلتوجهی یافته است، بهطوریکه گفته میشود 5 ثانیه ویدیوی باکیفیت را تقریباً در 2 دقیقه تولید میکند.
رویکرد Luma AI برای Dream Machine باعث شده این استارتاپ به یکی از بازیگران مهم حوزه هوش مصنوعی تولید ویدیو تبدیل شود. شرکتهای دیگری مانند OpenAI نیز با مدل Sora در این زمینه مشغول به کار هستند اما استراتژی Luma AI برای بهبود مستمر و عرضه عمومی مدل خود آن را از سایر گزینهها متمایز میکند.
مدل هوش مصنوعی Sora از OpenAI نیز هرچند قابلیتهای بسیار چشمگیری دارد، هماکنون بهصورت بتا و فقط در دسترس برخی شرکای آن قرار دارد.
پاسخ ها