Моё знакомство с Vertica

Автор: Константин Лисянский

Продолжая серию знакомств с “альтернативными” технологиями для хранилищ данных (DWH), я решил посмотреть на СУБД Vertica Analytical Database компании Vertica Systems. Вашему вниманию предлагаются основные моменты, которые я почерпнул из документов, предоставленных компанией.

Общая информация

Компания Vertica Systems является производителем колоночной СУБД (columnar database) для хранилищ данных. Одним из основателей компании является Майк Стоунбрейкер (Stonebraker), что уже говорит о многом. Информация о продукте доступна на сайте компании. Прототипом для коммерческой СУБД Vertica послужила академическая СУБД C-Store, которая разрабатывалась под руководством Стоунбрейкера.

Продукт можно причислить к классу software only, но, как и в случае с другими вендорами этого класса, Vertica в партнёрстве с HP и Red Hat предлагают комплекс для хранилищ данных (data warehouse appliance). Помимо этого, Vertica в партнёрстве с Amazon предлагает свою СУБД в режиме cloud computing.
Читать дальше »

Опубликовано 11.03.2009 | Автор сообщения Константин Лисянский | Категории: Cloud computing, DWH, MPP, MapReduce, RDF, Vertica, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, Лисянский, Константин, На русском, Руководитель подразделения BI/DWH Комментариев 6

Краткое представление технологии Exasol

Автор: Curt Monash
Дата публикации оригинала: 2008-08-16
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

После моего представления Exasol нетехнического характера у меня на это ушло 5 ½ месяцев, но, наконец, я получил информацию от технических специалистов Exasol (в частности, самую полезную помощь оказали Матиас Голомбек (Mathias Golombek) и Карстен Вейдманн (Carsten Weidmann)). Вот некоторые основные моменты:

Infobright раскрывает свой код

Автор: Curt Monash
Дата публикации оригинала: 2008-09-15
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

По своему недавно появившемуся обыкновению, при появлении какой-либо новости в индустрии я привожу ее краткий, тезисный анализ. Сегодня я делаю это по поводу Infobright и их перехода на стратегию открытого исходного кода. Если позволит погода, то после полудня я вылечу на конференцию Netezza (статья написана 15 сентября с.г.- прим. переводчика). И с четверга у меня было только 10 часов для сна. Поэтому я надеюсь, что этих тезисов будет достаточно, хотя, если это окажется не так, и вы мне напишите, то я попытаюсь ответить не позже утра вторника.

Читать дальше »

Опубликовано 18.11.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, DATAllegro, DWH, Greenplum, Infobright, Monash, Curt, MySQL, Netezza, Open Source, ParAccel, Teradata, Vertica, itblogs, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Сравнение/контраст между Vertica, ParAccel и Exasol

Автор: Curt Monash
Дата публикации оригинала: 2008-08-12
Источник: Блог Курта Монаша

Сегодня я общался с Exasol – в 5:00 утра! — и, конечно же, хочу написать об этом. Для внесения ясности, я хотел бы начать со сравнения/контраста между фундаментальными структурами данных в Vertica, ParAccel и Exasol. И, чувствуется, что это должно быть отдельным постом. Так что вот. Читать дальше »

Опубликовано 06.11.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Exasol, MPP, Monash, Curt, ParAccel, Vertica, itblogs, Архитектор BI, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH

Vertica — только схемы «звезда» и «снежинка»?

Автор: Curt Monash
Дата публикации оригинала: 2007-10-23
Источник: Блог Курта Монаша

Один из наиболее долгоживущих технологических споров, о которых я знаю, это спор приверженцев нормализованных хранилищ данных с приверженцами кубов, схем «звезда» (star schema) и «снежинка» (snowflake schema). Teradata, например, является флагманом первого лагеря; Microstrategy уверенно относится к последнему. (Однако это не удерживает множество розничных компаний от работы на Microstrategy поверх машин Teradata.) Attensity (хороший партнёр Teradata) принадлежит к первому лагерю; соперник по text mining компания Clarabridge (вроде бы, отпочковавшийся от Microstrategy) относится к последнему. И так далее.
Читать дальше »

Опубликовано 02.11.2008 | Автор сообщения Константин Лисянский | Категории: Monash, Curt, Vertica, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском

Сжатие данных в СУБД выходит на первый план

Автор: Curt Monash
Дата публикации оригинала: 2008-08-08
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Я уже много писал о сжатии данных в СУБД, ориентированных на хранилища данных; поставщики предподносят компрессию как одно из основных достоинств их продуктов, которое приносит непосредственную выгоду клиентам. Наиболее примечательной, вероятно, является короткая статья, которую Майк Стоунбрейкер (Mike Stonebraker) написал для этого блога, о тех преимуществах в области компрессии, которыми обладают СУБД с хранением данных по столбцам перед теми, в которых данные хранятся построчно, еще до того, как он и его коллеги открыли свой блог. Компрессия уже давно играет одну из главных ролей в истории DATAllegro, в то время, как Netezza занялась этим вопросом совсем недавно. Одной из причин, почему Teradata поставлена в невыгодное положение в плане ценовой политики, может служить как раз слабая компрессия. И так далее.

Читать дальше »

Опубликовано 06.10.2008 | Автор сообщения Олег Кузьменко | Категории: DATAllegro, DWH, Microsoft, Monash, Curt, Oracle, Teradata, Vertica, itblogs, Администратор БД, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор Комментариев 2

Разделение нагрузки между узлами MPP-систем хранилищ данных

Автор: Curt Monash
Дата публикации оригинала: 2008-09-05
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Я общаюсь со многими поставщиками СУБД, которые созданы для систем с массивно-параллельной обработкой (MPP-системы) и которые используются для построения хранилищ данных. Мне рассказали о весьма разных подходах к реализации архитектуры MPP, и мне кажется, что было бы интересным сравнить некоторые из них.

В базовом варианте архитектуры таких СУБД имеются два типа узлов: Читать дальше »

Опубликовано 02.10.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, Calpont, DWH, Exasol, Greenplum, MPP, Monash, Curt, Netezza, Vertica, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Позиционирование комплексов для хранилищ данных и специализированных СУБД

Автор: Curt Monash
Дата публикации оригинала: 2008-04-05
Перевод: Константин Лисянский
Источник: Блог Курта Монаша

Сегодня существуют четыре производителя аппаратного обеспечения, каждый из которых либо предлагает, либо готов предложить два различных уровня комплексов для хранилищ данных: Sun, HP, EMC и Teradata. А именно:

В добавление к этому, несколько производителей аппаратного обеспечения имеют технические договорённости с Oracle относительно “ссылочной архитектуры” в попытке получить некоторые из преимуществ комплексов. А IBM постоянно находится в состоянии переговоров с поставщиками специализированных систем в области хранилищ данных, несмотря на то, что у них у самих есть несколько предложения в области систем для хранилищ данных.
Читать дальше »

Опубликовано 04.09.2008 | Автор сообщения Константин Лисянский | Категории: DATAllegro, DWH, Dataupia, EMC, Greenplum, HP Neoview, IBM, Infobright, Kognitio, MPP, Microsoft, Monash, Curt, Netezza, Oracle, ParAccel, Sun, Sybase, Teradata, Vertica, itblogs, Архитектор BI, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Комплексы для хранилищ данных – факты и вымыслы

Автор: Curt Monash
Дата публикации оригинала: 2007-12-03
Перевод: Константин Лисянский
Источник: Блог Курта Монаша

Заняв мем “Факт или вымысел?” из спортивного мира:

Как Оракл будет спасать свой бизнес хранилищ данных?

Автор: Curt Monash
Дата публикации оригинала: 2008-07-24
Перевод: Константин Лисянский
Источник: Блог Курта Монаша

Купив DATAllegro, Microsoft серьёзно обошла Oracle в технологиях хранилищ данных (DWH). Несмотря на все сомнения относительно зрелости и многосторонности, DATAllegro имеет десятикратное или более преимущество (на самом деле, я думаю, что это примерно 20-40-кратное преимущество) против Oracle по размеру хранилищ данных, которые их технология способна непосредственно обрабатывать. Oracle не может себе позволить оставить этот ход без ответа.
Читать дальше »

Опубликовано 15.08.2008 | Автор сообщения Константин Лисянский | Категории: DATAllegro, Greenplum, Kognitio, Microsoft, Monash, Curt, Netezza, Oracle, ParAccel, Teradata, Vertica, itblogs, Архитектор BI, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH Комментариев 3