Копилефт лицензия CCAI, учитывающая применение для обучения AI-моделей

Группа исследователей из Йельского университета предложила (PDF) новый тип открытых лицензий CCAI (Contextual Copyleft), расширяющий применение копилефта к генеративным AI-моделям. Идея CCAI в том, что использование содержимого под данной лицензией в качестве данных для машинного обучения приводит к распространению условий копилефта на результирующие генеративные AI-модели. Предполагается, что новая лицензия может способствовать снижению злоупотреблений в AI-проектах и предотвращению появления фиктивных AI-моделей, которые формально преподносятся как открытые, но из-за скрытия исходных данных и инструментария для обучения, привязаны к производителю.

CCAI определяет, что любое распространение и публикация точных копий или изменённых производных работ, распространяемых под лицензией
CCAI, должно осуществляться под теми же лицензионными условиями без
наложения дополнительных ограничений. Данное требование распространяется на любую AI-модель, набор данных или AI-систему, при обучении которых использовалось ПО под лицензией CCAI или результат его работы. В контексте обучения генеративных AI-моделей CCAI требует раскрытия исходного кода модели, детального описания задействованных при обучении данных, параметров, весов и архитектуры модели.

Лицензию CCAI также можно использовать как дополнительное требование, прикрепляемое к существующим копилефт-лицензиям, таким как AGPLv3. Указанное требование расширяет действие лицензии на обучающие наборы данных, код и модели в соответствии с критериями открытости AI-систем, сформулированными организацией Open Source Initiative (OSI). Код, распространяемый под подобном лицензией, может использоваться для обучения AI-модели только при условии, что всем пользователям будет предоставлено описание обучающего набора данных, код для обучения модели и обученная AI-модель.

Текст прикрепляемого дополнительного требования: «При использовании программного обеспечения для обучения, оптимизации или создания любой модели машинного обучения или генеративной AI-системы, любая результирующая модель, набор данных или система должны публиковаться на условиях, не ужесточающих требования настоящей лицензии. Подобное требование охватывает предоставление доступа к коду для проведения обучения, описание данных, использованных при обучении, параметров и архитектуры модели. Предоставление доступа к модели или результату её работы по сети считается распространением и является основанием для выполнения накладываемых лицензией обязательств».

Источник: http://www.opennet.ru/opennews/art.shtml?num=64821