Переписывание кода при помощи AI для перелицензирования открытых проектов

Дэн Бланшар, разработчик библиотеки chardet для определения кодировки символов на языке Python, выпустил новую версию библиотеки под новой лицензией. В версии 7.0 используется лицензия MIT вместо лицензии LGPL. Разработчик утверждает, что AI-ассистент Anthropic Claude, который теперь числится в списке контрибьюторов, переписал библиотеку без использования оригинального кода, что позволило ему заменить копилефт лицензию на пермиссивную.

К обсуждению данного действия присоединился пользователь, который представился Марком Пилгримом, первоначальным создателем библиотеки (к сожалению учётная запись этого пользователя пустая и проверить является ли он тем кем представился невозможно) и создал issue, в котором утверждает, что у Дена нет прав изменять лицензию проекта.

Дэн возразил, что он сравнил версии 7.0.0 и 6.0.0 при помощи библиотеки для обнаружения плагиата и сходство между версиями составило меньше 1.3%. По его словам, ни один файл в кодовой базе версии 7.0.0 не похож по структуре ни на один файл из любого предыдущего релиза.

Ден рассказал, что хотел, чтобы библиотека chardet была включена в стандартную библиотеку Python, так как она является ключевой зависимостью для множества проектов на Python. Но интеграции мешали три препятствия — лицензия, скорость и точность. В результате проведённой работы скорость обнаружения кодировки библиотекой увеличилась в 48 раз.
Для проекта, который активно используется во многих других проектах, данная оптимизация приведёт к заметному повышению производительности для миллионов пользователей (пакет загружается около 130 миллионов раз в месяц).

Зои Койман, исполнительный директор Фонда свободного программного обеспечения, сообщила изданию The Register «Мы не можем комментировать конкретные детали или законность этого проекта без проведения дополнительных исследований или консультаций с юристами, но нет ничего «чистого» в том, чтобы большая языковая модель (LLM) использовала код, который от неё требуют переписать».

При этом Зои решила дать моральную оценку поступку Дена: «Что касается смысла GPL, то пермиссивная лицензия технически всё ещё является лицензией свободного программного обеспечения, но подрыв копилефта — это серьёзный поступок. Отказ предоставить другим права, которые вы сами получили как пользователь, является крайне антисоциальным, независимо от используемого метода.»

Брюс Перенс, автор оригинального определения открытого исходного кода, выразил озабоченность по поводу сложившейся ситуации: «Грядущие социальные изменения столь же масштабны, и, как мы уже видим, ещё более пугающие».

Юридические последствия применения большой языковой модели для переработки как открытых, так и проприетарных проектов (у которых был похищен исходный код) трудно предсказуемы и сильно зависят от прецедентов, создаваемых судами. Тем не менее, если большая языковая модель переписывает код на язык программирования, отличный от оригинала, то доказать создание производной работы становится практически невозможно.

Недавно Верховный суд США отказался пересмотреть дело «Талер против Перлмуттера«, в котором истец пытался отменить решение нижестоящего суда, согласно которому он не мог защитить авторским правом изображение, созданное искусственным интеллектом. Верховный суд США оставил в силе решение суда нижней инстанции о том, что произведения, полностью созданные AI, не защищаются авторским правом.

Источник: http://www.opennet.ru/opennews/art.shtml?num=64931