بریتانیکا و مریم-وبستر با ثبت شکایت از اوپن ای آی بابت کپی رایت، این غول هوش مصنوعی را به استفاده غیرمجاز از هزاران مقاله برای آموزش مدل های زبانی و رقابت ناعادلانه متهم کرده اند.
دانشنامه بریتانیکا و مریم-وبستر علیه OpenAI شکایت کردن و با این شکایت از اوپن ای آی بابت کپی رایت در دادخواست خودشون ادعا کردن که این غول هوش مصنوعی مرتکب «نقض گسترده کپی رایت» شده.
بریتانیکا که مالک مریم-وبستر هست، حق کپی رایت نزدیک به 100,000 مقاله آنلاین رو در اختیار داره. این ناشر در شکایتش ادعا کرده که این مقالات بدون اجازه استخراج شدن و برای آموزش مدل های زبانی بزرگ (LLM) شرکت OpenAI مورد استفاده قرار گرفتن. این شکایت، در واقع یک شکایت از اوپن ای آی بابت کپی رایت محتوای گسترده این دانشنامه است.
دلایل اصلی شکایت از اوپن ای آی بابت کپی رایت توسط بریتانیکا
بریتانیکا همچنین OpenAI رو متهم کرده که با تولید خروجی هایی که حاوی «بازتولید کامل یا جزئی کلمه به کلمه» محتواش هستن و همچنین با استفاده از مقالاتش در فرآیند RAG (تولید با بازیابی بهبودیافته) چت جی پی تی، قوانین کپی رایت رو نقض کرده. ابزار RAG شرکت OpenAI همون روشیه که مدل زبانی باهاش وب یا پایگاه های داده دیگه رو برای پیدا کردن اطلاعات جدید موقع پاسخ به سوالات اسکن می کنه. علاوه بر این، بریتانیکا ادعا می کنه که OpenAI با تولید «توهمات» (اطلاعات ساختگی) و نسبت دادن اشتباه اون ها به این ناشر، قانون لانهم (که یه قانون مربوط به علامت تجاری هست) رو هم نقض کرده. این موارد، از جمله محورهای اصلی در این شکایت از اوپن ای آی بابت کپی رایت به شمار می روند.
در این دادخواست اومده: «چت جی پی تی با تولید پاسخ هایی برای سوالات کاربرها که جایگزین محتوای ناشرانی مثل بریتانیکا می شه و مستقیما با اون ها رقابت می کنه، درآمد این ناشرها رو از بین می بره.» بریتانیکا همچنین ادعا می کنه که توهمات چت جی پی تی «دسترسی مداوم عموم به اطلاعات آنلاین باکیفیت و قابل اعتماد» رو به خطر می اندازه. تاثیر منفی بر درآمد و اعتبار، یکی از پیامدهای مهم این شکایت از اوپن ای آی بابت کپی رایت است.
بررسی موارد مشابه شکایت از اوپن ای آی بابت کپی رایت
بریتانیکا هم به جمع تعدادی از ناشرها و نویسنده های دیگه پیوسته که به خاطر مسائل کپی رایت از OpenAI شکایت کردن. این شرکت پیش از این هم با چالش های حقوقی متفاوتی روبرو بوده که از جمله آن ها می توان به نقش چت جی پی تی در خودکشی نوجوان در پرونده های قضایی دیگر اشاره کرد. نیویورک تایمز، زیف دیویس (مالک مشبل، سی نت، آی جی ان، پی سی مگ و غیره) و بیش از ده روزنامه در سراسر آمریکا و کانادا، از جمله شیکاگو تریبون، دنور پست، سان-سنتینل، تورنتو استار و شرکت پخش کانادا (CBC) از OpenAI شکایت کردن. این فهرست بلندبالا نشان دهنده ابعاد گسترده تر اعتراضات و شکایت از اوپن ای آی بابت کپی رایت است.
در کنار شکایت از اوپن ای آی بابت کپی رایت، شکایت مشابه بریتانیکا علیه Perplexity نیز هنوز در جریان هست که نشان از دغدغه های مشترک در صنعت نشر دارد.
هنوز سابقه حقوقی محکمی وجود نداره که مشخص کنه آیا استفاده از محتوای دارای کپی رایت برای آموزش یک مدل زبانی بزرگ، نقض کپی رایت محسوب می شه یا نه. اما در یک مورد خاص، شرکت Anthropic تونست قاضی فدرال، ویلیام آلسوپ رو متقاعد کنه که این مورد استفاده – یعنی استفاده از محتوا به عنوان داده های آموزشی – به اندازه کافی «تحول آفرین» هست که قانونی باشه. با این حال، آلسوپ استدلال کرد که Anthropic با دانلود غیرقانونی میلیون ها کتاب به جای پرداخت هزینه شون، قانون رو نقض کرده که این موضوع باعث شد حکمی برای پرداخت 1.5 میلیارد دلار غرامت در یک شکایت دسته جمعی به نویسندگان آسیب دیده صادر بشه.
شرکت OpenAI تا قبل از انتشار این خبر، به درخواست تک کرانچ برای اظهار نظر پاسخی نداد.
پرونده شکایت بریتانیکا علیه OpenAI نشان دهنده چالش های جدی در تعادل میان نوآوری های هوش مصنوعی و حفاظت از حقوق پدیدآورندگان است. با افزایش این نوع دادخواست ها، انتظار می رود که در آینده ای نزدیک، چهارچوب های قانونی دقیق تری برای استفاده از داده های آنلاین در آموزش مدل های هوش مصنوعی تدوین شود تا از تضادهای مشابه در دنیای دیجیتال جلوگیری گردد.