ادوبی با شکایت جمعی پیشنهادی روبرو شد؛ متهم به سوء استفاده از آثار نویسندگان در آموزش هوش مصنوعی

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.
ادوبی، مانند تقریباً هر شرکت فناوری دیگری که وجود دارد، در چند سال گذشته به شدت به سمت هوش مصنوعی رفته است. این شرکت نرمافزاری از سال ۲۰۲۳ تعدادی سرویس هوش مصنوعی مختلف را راهاندازی کرده است، از جمله Firefly — مجموعه تولید محتوای مبتنی بر هوش مصنوعی آن. اما اکنون، پذیرش کامل این فناوری توسط این شرکت ممکن است باعث دردسر شده باشد، زیرا یک شکایت جدید ادعا میکند که ادوبی از کتابهای دزدی برای آموزش یکی از مدلهای هوش مصنوعی خود استفاده کرده است.
یک شکایت جمعی پیشنهادی که به نمایندگی از الیزابت لیون، نویسندهای از اورگان، ثبت شده است، ادعا میکند که ادوبی از نسخههای دزدی شده از کتابهای متعدد — از جمله آثار خودش — برای آموزش برنامه SlimLM این شرکت استفاده کرده است.
ادوبی، SlimLM را به عنوان مجموعهای از مدلهای زبانی کوچک توصیف میکند که میتوانند «برای وظایف کمک به اسناد در دستگاههای تلفن همراه بهینهسازی شوند». این شرکت بیان میکند که SlimLM بر روی SlimPajama-627B، یک «مجموعه داده منبع باز، با دادههای تکراری حذف شده و از چندین منبع» که در ژوئن ۲۰۲۳ توسط Cerebras منتشر شد، پیشآموزش دیده است. لیون، که تعدادی کتاب راهنما برای نوشتن غیرداستانی نوشته است، میگوید که برخی از آثار او در مجموعه داده پیشآموزشی که ادوبی از آن استفاده کرده، گنجانده شده است.
شکایت لیون، که در ابتدا توسط رویترز گزارش شد، میگوید که نوشتههای او در زیرمجموعهای پردازش شده از یک مجموعه داده دستکاری شده که اساس برنامه ادوبی بوده، گنجانده شده است: «مجموعه داده SlimPajama با کپی کردن و دستکاری مجموعه داده RedPajama (از جمله کپی کردن Books3) ایجاد شده است»، این شکایت میگوید. «بنابراین، از آنجایی که یک کپی مشتق شده از مجموعه داده RedPajama است، SlimPajama حاوی مجموعه داده Books3 است، از جمله آثار دارای حق چاپ شاکی و اعضای گروه.»
«Books3» — یک مجموعه عظیم از ۱۹۱,۰۰۰ کتاب که برای آموزش سیستمهای GenAI استفاده شده است — منبع مداوم دردسرهای حقوقی برای جامعه فناوری بوده است. RedPajama نیز در تعدادی از پروندههای حقوقی ذکر شده است. در ماه سپتامبر، شکایتی علیه اپل ادعا کرد که این شرکت از مطالب دارای حق چاپ برای آموزش مدل Apple Intelligence خود استفاده کرده است. این دعوی حقوقی به مجموعه داده اشاره کرد و شرکت فناوری را به کپی کردن آثار محافظت شده «بدون رضایت و بدون ذکر نام یا جبران خسارت» متهم کرد. در ماه اکتبر، یک شکایت مشابه علیه Salesforce نیز ادعا کرد که این شرکت از RedPajama برای اهداف آموزشی استفاده کرده است.
متأسفانه برای صنعت فناوری، چنین شکایاتی تا به امروز تا حدودی رایج شدهاند. الگوریتمهای هوش مصنوعی بر روی مجموعه دادههای عظیم آموزش میبینند و در برخی موارد، این مجموعه دادهها ادعا میشود که شامل مطالب دزدی شده بودهاند. در ماه سپتامبر، Anthropic موافقت کرد که ۱.۵ میلیارد دلار به تعدادی از نویسندگان که از آن شکایت کرده بودند و آن را به استفاده از نسخههای دزدی شده از آثارشان برای آموزش چتبات خود، Claude، متهم کرده بودند، پرداخت کند. این پرونده نقطه عطفی بالقوه در نبردهای حقوقی جاری بر سر مطالب دارای حق چاپ در دادههای آموزشی هوش مصنوعی، که تعدادشان بسیار زیاد است، در نظر گرفته شد.



