AI

ادوبی با شکایت جمعی پیشنهادی روبرو شد؛ متهم به سوء استفاده از آثار نویسندگان در آموزش هوش مصنوعی

3 دقیقه مطالعه
منبع
ادوبی با شکایت جمعی پیشنهادی روبرو شد؛ متهم به سوء استفاده از آثار نویسندگان در آموزش هوش مصنوعی

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.

ادوبی، مانند تقریباً هر شرکت فناوری دیگری که وجود دارد، در چند سال گذشته به شدت به سمت هوش مصنوعی رفته است. این شرکت نرم‌افزاری از سال ۲۰۲۳ تعدادی سرویس هوش مصنوعی مختلف را راه‌اندازی کرده است، از جمله Firefly — مجموعه تولید محتوای مبتنی بر هوش مصنوعی آن. اما اکنون، پذیرش کامل این فناوری توسط این شرکت ممکن است باعث دردسر شده باشد، زیرا یک شکایت جدید ادعا می‌کند که ادوبی از کتاب‌های دزدی برای آموزش یکی از مدل‌های هوش مصنوعی خود استفاده کرده است.

یک شکایت جمعی پیشنهادی که به نمایندگی از الیزابت لیون، نویسنده‌ای از اورگان، ثبت شده است، ادعا می‌کند که ادوبی از نسخه‌های دزدی شده از کتاب‌های متعدد — از جمله آثار خودش — برای آموزش برنامه SlimLM این شرکت استفاده کرده است.

ادوبی، SlimLM را به عنوان مجموعه‌ای از مدل‌های زبانی کوچک توصیف می‌کند که می‌توانند «برای وظایف کمک به اسناد در دستگاه‌های تلفن همراه بهینه‌سازی شوند». این شرکت بیان می‌کند که SlimLM بر روی SlimPajama-627B، یک «مجموعه داده منبع باز، با داده‌های تکراری حذف شده و از چندین منبع» که در ژوئن ۲۰۲۳ توسط Cerebras منتشر شد، پیش‌آموزش دیده است. لیون، که تعدادی کتاب راهنما برای نوشتن غیرداستانی نوشته است، می‌گوید که برخی از آثار او در مجموعه داده پیش‌آموزشی که ادوبی از آن استفاده کرده، گنجانده شده است.

شکایت لیون، که در ابتدا توسط رویترز گزارش شد، می‌گوید که نوشته‌های او در زیرمجموعه‌ای پردازش شده از یک مجموعه داده دستکاری شده که اساس برنامه ادوبی بوده، گنجانده شده است: «مجموعه داده SlimPajama با کپی کردن و دستکاری مجموعه داده RedPajama (از جمله کپی کردن Books3) ایجاد شده است»، این شکایت می‌گوید. «بنابراین، از آنجایی که یک کپی مشتق شده از مجموعه داده RedPajama است، SlimPajama حاوی مجموعه داده Books3 است، از جمله آثار دارای حق چاپ شاکی و اعضای گروه.»

«Books3» — یک مجموعه عظیم از ۱۹۱,۰۰۰ کتاب که برای آموزش سیستم‌های GenAI استفاده شده است — منبع مداوم دردسرهای حقوقی برای جامعه فناوری بوده است. RedPajama نیز در تعدادی از پرونده‌های حقوقی ذکر شده است. در ماه سپتامبر، شکایتی علیه اپل ادعا کرد که این شرکت از مطالب دارای حق چاپ برای آموزش مدل Apple Intelligence خود استفاده کرده است. این دعوی حقوقی به مجموعه داده اشاره کرد و شرکت فناوری را به کپی کردن آثار محافظت شده «بدون رضایت و بدون ذکر نام یا جبران خسارت» متهم کرد. در ماه اکتبر، یک شکایت مشابه علیه Salesforce نیز ادعا کرد که این شرکت از RedPajama برای اهداف آموزشی استفاده کرده است.

متأسفانه برای صنعت فناوری، چنین شکایاتی تا به امروز تا حدودی رایج شده‌اند. الگوریتم‌های هوش مصنوعی بر روی مجموعه داده‌های عظیم آموزش می‌بینند و در برخی موارد، این مجموعه داده‌ها ادعا می‌شود که شامل مطالب دزدی شده بوده‌اند. در ماه سپتامبر، Anthropic موافقت کرد که ۱.۵ میلیارد دلار به تعدادی از نویسندگان که از آن شکایت کرده بودند و آن را به استفاده از نسخه‌های دزدی شده از آثارشان برای آموزش چت‌بات خود، Claude، متهم کرده بودند، پرداخت کند. این پرونده نقطه عطفی بالقوه در نبردهای حقوقی جاری بر سر مطالب دارای حق چاپ در داده‌های آموزشی هوش مصنوعی، که تعدادشان بسیار زیاد است، در نظر گرفته شد.