Моё знакомство с Greenplum
Автор: Константин Лисянский
Немного познакомившись с технолоией DATAllegro я решил посмотреть на одного из их конкурентов - Greenplum.
Информация об этом производителе присутствует ограниченно на нашем сайте, в основном, в статьях Курта Монаша. Поэтому я решил составить своё (пока поверхностное) мнение о их продукте.
Общая информация
Компания Greenplum является производителем СУБД для хранилищ данных под названием Greenplum Database.
Gartner позиционирует Greenplum как Visionary.
Информация о продукте доступна на сайте Greenplum. Как и в случае с DATAllegro, в открытом доступе информации о продукте немного. Ничего страшного - регистрируемся и получаем доступ к материалам о продукте, статьям аналитиков, видео-записям. Помимо этого можно зарегистрироваться на сайте поддержки и скачать документацию на продукт и, собственно, сам продукт. К слову сказать, после скачивания продуктом можно свободно пользоваться в целях разработки. Чтобы продукт использовать коммерчески его придётся купить.
До скачивания продукта я не дошёл, а вот, с документацией и статьями немного познакомился. Хочу поделиться тем, что я узнал.
Технология
Выше я написал, что продукт компании - это СУБД для хранилищ данных. Но, нужно также отметить, что Greenplum совместно с компанией Sun предлагают комплекс (data warehouse appliance). Это достаточно очевидно, поскольку все остальные (наверное, уже без исключения) производители комплексов предлагают сбалансированные конфигурации. Но, собрать себе систему и сделать из неё комплес посредством установки софта тоже можно.
Продукт открытый - в качестве основы продукта используется СУБД с открытым кодом PostgreSQL (с доработками Greenplum, делающими из неё массивно-параллельную СУБД).
В качестве аппаратной платформы можно использовать любые общедоступные серверы. В качестве коммутатора используется Gigabit Ethernet (замечу, что DATAllegro использует более скоростной Infiniband, а Teradata - “умный” BYNET). Вот такое хранилище “для бедных”.
Среди особенностей, выделяющих Greenplum на фоне остальных является то, что кроме SQL они достаточно активно пропагандируют MapReduce (другим производителем со схожей идеей является Aster Data). Соответственно, они предлагают использовать свой комплекс не только как СУБД, но и как механизм параллельного выполнения более широкого класса алгоритмов (которые уже разработаны, или которые можно разработать с применением MapReduce).
Другие технические характеристики:
- Greenplum Database хранит данные по строкам.
- Используется сжатие данных.
- Есть поддержка нескольких типов индексов, включая bitmap index.
- Распределение данных между узлами обработки осуществляется либо хэшированием (рекомендуемый способ), либо случайным образом (round robbin).
- Естественно, активно используется параллельная обработка (для чего соответствующие модули PostgeSQL и были переписаны).
- Имеются средства резервирования узлов обработки данных для обеспечения отказоустойчивости системы в целом.
- Средства администрирования и мониторинга достаточно бедны - нет графических утилит, для всего предлагается пользоваться утилитами командной строки.
Пока напрашивается ярлык “недотерадата”, но, возможно, познакомившись с продуктом поближе, я смогу сделать другой вывод. В конце концов, позиционируют они себя…
Позиционирование
Как и DATAllegro, Greenplum позиционируется как дешёвая замена Teradata, при этом ещё и более высокопроизводительная (что для меня пока не очевидно, ибо я не понимаю за счёт чего). Кроме Teradata к своим конкурентам относят DATAllegro и Netezza.
Стоимость
Как уже писалось выше, Greenplum позиционируется как более дешёвая платформа, чем, к примеру, Teradata. Например, в одной из брошюр я вычитал сумму в 20 тысяч долларов за 1 терабайт. Здесь сложно сравнивать с другими, поскольку для сравнения нужно привести всех к общему знаменателю, а сделать это мысленно мне, например, достаточно сложно. Поэтому ограничусь пока этим.
Клиенты
Здесь, как мне показалось, Greenplum выглядит лучше, чем DATAllegro. На сайте приведён список из 12 клиентов, среди которых достаточно известные компании (к примеру, NYSE).
Хочется пожелать, чтобы их было побольше, поскольку технология, на мой взгляд, перспективная. Интересно, купит ли их кто-нибудь из больших вендоров?
Заключение
Кому интересно дальше познакомиться с этим продуктом - рекомендую зарегистрироваться на их сайте и почитать материалы. Может быть, кто-то захочет поставить софт - интересно было бы послушать отзывы от экспериментаторов.
Мы продолжим наблюдение за этой технологией. Следите за публикациями!
Для удобства отслеживания новых публикаций рекомендуем подписаться на рассылку или на канал RSS.