مدیرعامل این شرکت میگوید که برای کاهش دیپفیکها باید از واترمارک دیجیتالی استفاده کرد تا صداهای هوش مصنوعی مشخص شوند.
شرکت ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعالیت دارد، مدتهاست که با دیپفیک دستوپنجه نرم میکند. فناوری هوش مصنوعی مولد صدا، درحالی که کارکردهای مفید بسیاری دارد، اما پتانسیل آن برای سوءاستفاده نیز زیاد است. اکنون مدیرعامل ElevenLabs گفته است قراردادن واترمارک دیجیتالی روی صداهای هوش مصنوعی میتواند راهحل مقابله با دیپفیکهای صوتی باشد.
براساس گزارش آتلانتیک، «متی استانیشفسکی» (Mati Staniszewski)، مدیرعامل و همبنیانگذار ElevenLabs، ضمن اشاره به اینکه مقابله با سوءاستفادهگران یک بازی موشوگربه خواهد بود، میگوید که واترمارک دیجیتالی میتواند راهحلی برای کاهش دیپفیکها باشد.
ElevenLabs که پس از راهاندازی نسخه بتا در سال 2023 به ارزش 1.1 میلیارد دلار رسید، از هوش مصنوعی برای تولید کلیپهای صوتی استفاده میکند. از ابزارهای این شرکت میتوان برای تبدیل متن به گفتار، دوبله صدا به 29 زبان و شبیهسازی صداها بهره برد. این شرکت ادعا میکند که کاربرانش در سال گذشته میلادی بیش از 100 سال با این هوش مصنوعی صدا تولید کردهاند.
بااینحال، قانونگذاران نگران هستند که این فناوری پتانسیل خطرناکی برای سوءاستفاده داشته باشد. پیشرفتهای هوش مصنوعی مولد صدا، با افزایش کلاهبرداریهای تلفنی همراه بوده است که در آن کلاهبرداران خود را شخص دیگری معرفی میکنند.
بااینحال متی استانیشفسکی معتقد است که فناوری ElevenLabs میتواند بسیار سودمند باشد، برای مثال این فناوری میتواند به افراد مبتلا به بیماریهای عصبی مانند ALS کمک کند تا اگر توانایی صحبتکردن خود را از دست دادهاند، بتوانند دوباره صدای خود را بازیابند. همچنین از این فناوری میتوان برای کمک به برقراری ارتباط میان مردم با زبانهای مختلف استفاده کرد.
استانیشفسکی میگوید برای استفاده درست از پتانسیل این فناوری، کاربران باید بتوانند صداهای تولیدشده توسط هوش مصنوعی را از صدای انسان تشخیص دهند. بهزعم او راهحل واقعی این است که به صورت دیجیتالی صداهای مصنوعی را واترمارک کرد.
پاسخ ها