Базираната в Холандия група за налагане на авторски права BREIN е премахнала голям набор от езикови данни, който се използват при обучение на AI модели.
Наборът от данни включва информация, събрана без разрешение от десетки хиляди книги, новинарски сайтове и субтитри на холандски език, от „безброй“ филми и телевизионни сериали, се казва в изявление на BREIN.
Пред Ройтерс директорът Бастиан ван Рамсхорст казва, че не е ясно дали и колко голям набор от данни е бил използван от компаниите за изкуствен интелект.
Законът за изкуствения интелект на Европейския съюз ще изисква фирмите за изкуствен интелект да разкриват какви масиви от данни са употребявани, за да обучат своите модели.
В САЩ, подкрепяният от Microsoft OpenAI беше засегнат от няколко съдебни дела, включително едно от New York Times за предполагаемо използване на материали с авторски права за обучение на своите модели без разрешение.
В Дания група за защита на авторските права, наречена Danish Rights Alliance, принудително премахна огромен набор от данни, известен като "Books3", миналата година, припомня изданието. Лицето, което е предлагало холандския набор от данни, се е съгласило с условията на заповедта за прекратяване и го е премахнало от уебсайта, където е било достъпно за изтегляне, каза BREIN. Организацията не разкрива самоличността на лицето, позовавайки се на холандските права за защита на личните данни.