مدل توربو جدید ElevenLabs در کمتر از 400 میلیثانیه متن را به گفتار تبدیل میکند.
شرکت هوش مصنوعی ElevenLabs از مدل Turbo نسخه 2.5 رونمایی کرد. این مدل تبدیل متن به گفتار با تأخیر کم از 32 زبان پشتیبانی میکند. در نسخه جدید این مدل، زبانهای جدیدی مانند ویتنامی، مجارستانی و نروژی اضافه شدهاند. از ویژگیهای فوقالعاده این مدل تأخیر بسیار کمتر آن هنگام تولید صداست.
براساس اعلام ElevenLabs، در Turbo 2.5، تولید گفتار در زبانهای هندی، فرانسوی، اسپانیایی، ماندارین و 27 زبان دیگر سه برابر سریعتر از نسخههای قبلی است. زبان انگلیسی نیز 25 درصد سریعتر شدهاند. همچنین با Turbo 2.5 API توسعهدهندگان شخص ثالث میتوانند از این مدل جدید در سختافزارهایشان مانند عینک هوشمند استفاده کنند تا کاربران درگیر مشکلات بینایی بتوانند متنی را که روبهرویشان است، به گفتار تبدیل کنند و آن را بشنوند. همچنین این مدل در ویدیوگیم نیز میتواند برای صداگذاری کاراکترهای بازی کاربرد داشته باشد.
مدل Turbo v2.5 فناوری پیشرفته تبدیل متن به گفتار را با تأخیر کم ارائه میدهد و خروجی صدایی را که هوش مصنوعی با کیفیت بالا تولید کرده است، تقریباً بدون نیاز به انتظار برای کاربر پخش میکند. در واقع این مدل توربو جدید با صدایی باکیفیت در کمتر از 400 میلیثانیه متن را به گفتار تبدیل میکند.
ElevenLabs که سال 2022 تأسیس شد، روی توسعه مدلها و ابزارهای گفتاری و صداگذاری هوش مصنوعی تمرکز دارد. مدیرعامل این شرکت اخیراً گفته بود ElevenLabs درحالحاضر حدود 40 کارمند دورکار در سراسر جهان دارد و قصد دارد تا پایان 2024 این تیم را به 100 نفر افزایش دهد.
شرکت ElevenLabs اخیراً نیز ابزار جدیدی با نام AI Voice Isolator را برای کاهش نویز معرفی کرده بود. این ابزار به کاربران امکان میدهد نویز و صداهای ناخواسته را از ویدیو و پادکستهایشان حذف کنند. برای استفاده از این ابزار فقط باید محتوایی را که میخواهید صدایش بهبود پیدا کند، آپلود کنید. مدل این شرکت پس از پردازش محتوا، نویز آن را حذف میکند.
پاسخ ها