Выпуск Apache Cloudberry 2.1.0, открытой альтернативы СУБД Greenplum

Представлен выпуск распределённой СУБД Apache Cloudberry 2.1.0, продолжающей развитие открытой кодовой базы СУБД Greenplum, которая была превращена компанией Broadcom в закрытый продукт после приобретения VMware. Проект пока находится в инкубаторе Apache и будет переведён в число первичных проектов Apache после готовности инфраструктуры и сопровождающих.

СУБД Cloudberry представляет собой распределённую редакцию открытой СУБД PostgreSQL, оптимизированную для выполнения аналитических запросов над большими массивами данных (Data Warehouse). Для параллельной обработки данных применяется массово-параллельная архитектура (MPP, massively parallel processing), обеспечивающая масштабируемость хранилища до петабайтных размеров за счёт разделения данных на сегменты и задействования для их хранения и обработки кластера из группы серверов.

Среди улучшений в Apache Cloudberry 2.1.0:

  • Реализован протокол UDP2 для взаимодействия между узлами, позволивший повысить эффективность распределённого выполнения запросов.
  • Добавлена поддержка MCP-сервера (Model Context Protocol) для упрощения интеграции с инструментами на базе больших языковых моделей.
  • Добавлена возможность применения алгоритма LZ4 для сжатия столбцов таблиц с целью сокращения ввода/вывода и снижения потребления памяти.
  • Улучшена работа оптимизатора ORCA.
  • Скрипт greenplum_path.sh, используемый для настройки окружения пользователя СУБД, заменён на cloudberry-env.sh.
  • Инструментарий для резервного копирования переименован в cloudberry-backup. В основной репозиторий включён плагин для хранилищ на базе протокола S3.

Источник: http://www.opennet.ru/opennews/art.shtml?num=65253