ElevenLabs از هوش مصنوعی تبدیل متن به گفتار Turbo 2.5 رونمایی کردید [تماشا کنید]

ElevenLabs از هوش مصنوعی تبدیل متن به گفتار Turbo 2.5 رونمایی کرد [تماشا کنید]

مدل توربو جدید ElevenLabs در کمتر از 400 میلی‌ثانیه متن را به گفتار تبدیل می‌کند.

شرکت هوش مصنوعی ElevenLabs از مدل Turbo نسخه 2.5 رونمایی کرد. این مدل تبدیل متن به گفتار با تأخیر کم از 32 زبان پشتیبانی می‌کند. در نسخه جدید این مدل، زبان‌های جدیدی مانند ویتنامی، مجارستانی و نروژی اضافه شده‌اند. از ویژگی‌های فوق‌العاده این مدل تأخیر بسیار کمتر آن هنگام تولید صداست.

براساس اعلام ElevenLabs، در Turbo 2.5، تولید گفتار در زبان‌های هندی، فرانسوی، اسپانیایی، ماندارین و 27 زبان دیگر سه برابر سریع‌تر از نسخه‌های قبلی است. زبان انگلیسی نیز 25 درصد سریع‌تر شده‌اند. همچنین با Turbo 2.5 API توسعه‌دهندگان شخص ثالث می‌توانند از این مدل جدید در سخت‌افزارهایشان مانند عینک هوشمند استفاده کنند تا کاربران درگیر مشکلات بینایی بتوانند متنی را که روبه‌رویشان است، به گفتار تبدیل کنند و آن را بشنوند. همچنین این مدل در ویدیوگیم نیز می‌تواند برای صداگذاری کاراکترهای بازی کاربرد داشته باشد.

مدل هوش مصنوعی Turbo 2.5 برای تبدیل متن به گفتار

مدل Turbo v2.5 فناوری پیشرفته تبدیل متن به گفتار را با تأخیر کم ارائه می‌دهد و خروجی صدایی را که هوش مصنوعی با کیفیت بالا تولید کرده است، تقریباً بدون نیاز به انتظار برای کاربر پخش می‌کند. در واقع این مدل توربو جدید با صدایی باکیفیت در کمتر از 400 میلی‌ثانیه متن را به گفتار تبدیل می‌کند.

ElevenLabs که سال 2022 تأسیس شد، روی توسعه مدل‌ها و ابزارهای گفتاری و صداگذاری هوش مصنوعی تمرکز دارد. مدیرعامل این شرکت اخیراً گفته بود ElevenLabs درحال‌حاضر حدود 40 کارمند دورکار در سراسر جهان دارد و قصد دارد تا پایان 2024 این تیم را به 100 نفر افزایش دهد.

شرکت ElevenLabs اخیراً نیز ابزار جدیدی با نام AI Voice Isolator را برای کاهش نویز معرفی کرده بود. این ابزار به‌ کاربران امکان می‌دهد نویز و صداهای ناخواسته را از ویدیو و پادکست‌هایشان حذف کنند. برای استفاده از این ابزار فقط باید محتوایی را که می‌خواهید صدایش بهبود پیدا کند، آپلود کنید. مدل‌ این شرکت پس از پردازش محتوا، نویز آن را حذف می‌کند.