نیویورک تایمز OpenAI را به حذف عمدی شواهد مربوط به داده های آموزشی هوش مصنوعی متهم کرد

طبق این گزارش، وکلای نیویورک تایمز و نشریات دیگر بیش از 150 ساعت را صرف جمع‌آوری این داده‌ها کرده‌اند که توسط OpenAI حذف شده است.

مهندسان OpenAI ظاهراً به اشتباه شواهد مهمی که توسط نیویورک‌تایمز و نشریات دیگر در مورد داده‌های آموزش هوش مصنوعی آن جمع‌آوری شده را حذف کرده‌اند.

براساس گزارش ورج، تیم حقوقی این نشریات بیش از 150 ساعت از زمان خود را صرف جستجو داده‌های آموزشی هوش مصنوعی OpenAI کرده‌اند. آن‌ها با انجام این کار تلاش داشتند تا داده‌هایی را پیدا کنند که در آن از مقالات خبری نیویورک‌تایمز استفاده شده است. بااین‌حال، داده‌های جمع‌آوری شده به شیوه نامشخصی حذف شده‌اند و حتی مشخص نیست که این داده‌ها دقیقاً چه چیزهایی را شامل می‌شدند.

در پرونده‌ای که توسط نیویورک‌تایمز به ثبت رسیده گفته شده که OpenAI به اشتباه خود اعتراف کرده و سپس تلاش داشته تا داد‌‌ها را بازیابی کند، اما داده‌های بازیابی شده «ناقص و غیرقابل اعتماد» بوده‌اند.

درحالی که وکلای OpenAI پاک‌شدن داده‌ها را یک «اشکال» می‌دانند، اما وکلای نیویورک‌تایمز خاطرنشان کرده‌اند که «هیچ دلیل برای باور» حذف عمدی آن‌ها وجود ندارد.

نبرد حقوقی بین نیویورک تایمز و OpenAI

نبرد بین نیویورک‌تایمز و OpenAI از دسامبر سال گذشته آغاز شد، زمانی که این نشریه ادعا کرد که سازنده ChatGPT و شریک آن، مایکروسافت، برای ساخت ابزارهای هوش مصنوعی خود «از میلیون‌ها مقاله این نشریه» استفاده کرده‌اند و حالا به‌طور مستقیم با محتوای آن در رقابت است.

نیویورک‌تایمز از OpenAI می‌خواهد به‌خاطر کپی‌کردن محتوای آن، مسئولیت «میلیاردها دلار خسارت قانونی و واقعی» را بپذیر.

این نشریه ظاهراً تاکنون بیش از 1 میلیون دلار برای مبارزه با OpenAI هزینه کرده است، هزینه‌ای که ناشران کمی می‌توانند آن را پرداخت کنند. از سویی دیگر، OpenAI با رسانه‌های بزرگی از جمله Axel Springer و Vox Media (مالک ورج) قراردادهایی را منعقد کرده است که نشان می‌دهد بسیاری از ناشران ترجیح می‌دهند شریک آن باشند تا با OpenAI مبارزه کنند.