هوش مصنوعی تقلید صدا Voice Engine شرکت OpenAI میتواند متون را با صدای شما در زبانهای مختلف بخواند.
شرکت OpenAI وارد دنیای مدلهای هوش مصنوعی تقلید صدا شد. این شرکت از هوش مصنوعی تقلید صدا Voice Engine رونمایی کرده که میتواند با کلیپهای صوتی ۱۵ ثانیهای، صدای مصنوعی بسازد. این صدای تولیدشده با هوش مصنوعی میتواند دستورات متنی را به زبانهای مختلفی بخواند. البته این ابزار بهطور بسیار محدود عرضه شده است.
درحالحاضر شرکتهای بسیار کمی ازجمله Age of Learning و HeyGen به ابزار جدید OpenAI دسترسی پیدا کردهاند. در نمونههای صوتی که OpenAI منتشر کرده، زبانهای مختلفی ازجمله انگلیسی، آلمانی، فرانسوی و ژاپنی به چشم میخورند. درحقیقت این ابزار نهتنها میتواند با زبان اصلی فایل صوتی، متنهای مختلف را بخواند، بلکه امکان خواندن متن با زبانهای دیگر را هم دارد.
به گفته OpenAI، این شرکت از اواخر ۲۰۲۲ شروع به توسعه Voice Engine کرده است و این فناوری هماکنون در API تبدیل متن به صدا و همچنین قابلیت Read Aloud چتبات ChatGPT وجود دارد. به گفته یکی از اعضای تیم محصول Voice Engine به نام «جف هریس»، این ابزار با ترکیبی از دادههای دارای حق کپیرایت و دادههای عمومی آموزش داده شده و تنها در اختیار نزدیک به ۱۰ توسعهدهنده قرار گرفته است.
در ادامه صدای تولیدشده توسط Age of Learning را میشنوید که در آن هوش مصنوعی با صدای مرجع، درباره زیستشناسی و شیمی صحبت میکند. همانطور که بالاتر گفتیم، این ابزار با استفاده از صدای شما، متن درخواستیتان را میخواند.
تبدیل متن به صدا به هوش مصنوعی درحال تکامل است و درحالیکه بسیاری از شرکتها روی تولید صداهای طبیعی یا آلات موسیقی تمرکز کردهاند، استارتاپهای کمی به سراغ تولید صدای افراد رفتهاند. البته در میان همین استارتاپها، نامهای مطرحی مانند ElevenLabs هم وجود دارد.
درحالی OpenAI به سراغ ابزار تقلید صدا رفته که نگرانیهایی درباره سوءاستفاده از این ابزارها وجود دارد. بااینحال OpenAI میگوید درباره پیروی از سیاستهای خود، با شرکا به توافق رسیده است. طبق این سیاستها، نباید از هوش مصنوعی تقلید صدای OpenAI برای جعل هویت افراد و سازمانها بدون رضایت آنها استفاده کرد.
OpenAI همچنین از شرکای خود میخواهد که «رضایت صریح و آگاهانه» گوینده اصلی را داشته باشند. به صداهای تولیدشده با هوش مصنوعی، واترمارک زده میشود تا بتوان منشأ آنها را پیدا کرد و البته روی نحوه استفاده از آنها نظارت داشت.
سازنده ابزار تقلید صدا Voice Engine چندین گام را برای محدودکردن امکان سوءاستفاده از این ابزارها پیشنهاد کرده است. ازجمله این پیشنهادات میتوان به حذف تدریجی احراز هویت صوتی برای دسترسی به حسابهای بانکی، تنظیم سیاستهایی برای محافظت از صدای افراد در هوش مصنوعی، آموزشهای بهتر درباره دیپفیک و همچنین توسعه سیستمهای ردیابی محتواهای ساختهشده با هوش مصنوعی اشاره کرد.
پاسخ ها