Проект Open-Assistant развивает открытый AI-бот, похожий на ChatGPT

Организация LAION (Large-scale Artificial Intelligence Open Network), развивающая инструменты, модели и коллекции данных для создания свободных систем машинного обучения (например, коллекция LAION используется для обучения моделей системы синтеза изображений Stable Diffusion), основала проект Open-Assistant, в рамках которого началась разработка чат-бота с искусственным интеллектом, напоминающего по своим возможностям проприетарный сервис ChatGPT и способного понимать вопросы на естественном языке, взаимодействовать со сторонними системами и динамически извлекать необходимую информацию. Код проекта написан на языке Python и распространяется под лицензией Apache 2.0.

Ожидается, что Open-Assistant подстегнёт развитие открытых разработок о области формирования контента и обработки запросов на естественных языках, как в своё время открытый проект Stable Diffusion стимулировал развитие средств для генерации изображений. Проект нацелен на создание интеллектуального помощника будущего и не планирует останавливаться на повторении возможностей ChatGPT. Например, кроме таких функций, как написание сообщений и электронных писем, планируется научить бот выполнять более значимую работу, использовать API и динамически исследовать информацию, предоставляя при этом средства для расширения и персонализации. Так же планируется предоставить максимально компактное и эффективное решение, способное выполняться на обычном потребительском оборудовании.

Проектом развивается общедоступная языковая модель, обученная на большой коллекции данных и усиленная через применение методов обучения с подкреплением и привлечение энтузиастов для получения обратной связи о качестве диалогов. На первом этапе для обучения планируется задействовать как минимум 50 тысяч примеров диалогов в форме запрос-ответ (инструкция-выполнение), подготовленных и рецензированных с привлечением сообщества энтузиастов.

В дальнейшем для повышения эффективности системы и ухода от необходимости хранения миллиардов предопределённых параметров, в проекте намерены использовать динамически обновляемую базу знаний, способную извлекать требуемую информацию через поисковые системы.
Проектом также будет предоставлен инструментарий, позволяющий без ограничений использовать подготовленную модель, развивать её с учётом собственных предпочтений и создавать на её основе свои приложения и сервисы.

Источник: http://www.opennet.ru/opennews/art.shtml?num=58606