انویدیا مدل هوش مصنوعی Fugatto را معرفی کرد. تولید صدا از دستورات متنی [watch]

انویدیا مدل هوش مصنوعی Fugatto را معرفی کرد؛ تولید صدا از روی دستورات متنی [تماشا کنید]

این مدل امکان ویرایش فایل‌های صوتی از پیش ساخته شده را نیز دارد.

انویدیا به‌تازگی مدل هوش مصنوعی جدیدی به نام Fugatto را معرفی کرده است که می‌تواند دستورات متنی کاربران را به صدا تبدیل یا با استفاده از این دستورها، فایل‌های صوتی را ویرایش کند.

انویدیا پادشاه مطلق بازار تراشه‌های هوش مصنوعی است، اما این شرکت در زمینه ساخت مدل‌های نرم‌افزاری هوش مصنوعی نیز ازجمله پیشگامان محسوب می‌شود. جدیدترین مدل هوش مصنوعی معرفی شده توسط انویدیا که این شرکت آن را «چاقوی سوئیسی برای صدا» توصیف می‌کند، می‌تواند ابزاری بسیار کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.

Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار نگرفته است

به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا به‌اختصار Fugatto می‌تواند دستوراتش را به‌صورت متنی از کاربران دریافت کرده و منطبق با این دستورات، فایل‌های صوتی بسازد. کاربران همچنین می‌توانند از Fugatto برای ویرایش فایل‌های صوتی ازپیش‌ساخته شده نیز استفاده کنند.

این مدل هوش مصنوعی توسط تیمی از متخصصان این حوزه در سراسر جهان ساخته شده. همچنین انویدیا می‌گوید که این موضوع باعث قوی‌تر شدن قابلیت‌های چندزبانی و چندلهجه‌ای Fugatto شده است.

«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراین‌باره می‌گوید قصد آن‌ها ساخت مدلی بوده که صدا را مانند انسان‌ها درک و تولید کند. انویدیا برخی از سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده که Fugatto می‌تواند برای آنها کاربردی باشد.

برای مثال، تولیدکنندگان موسیقی می‌توانند از این مدل هوش مصنوعی برای تولید نمونه‌های اولیه یک آهنگ استفاده کرده و سپس به‌راحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعه‌دهندگان بازی‌های ویدیویی نیز می‌توانند نهایت استفاده را از قابلیت‌های مدل Fugatto ببرند. البته Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار ندارد، و انویدیا نیز نگفته که چه زمانی دسترسی عمومی به آن فراهم می‌شود.

شرکت‌های متا و گوگل نیز پیش‌ازاین مدل‌های هوش مصنوعی مشابهی را معرفی کرده بودند که می‌توانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.