Моё знакомство с Vertica

Автор: Константин Лисянский

Продолжая серию знакомств с “альтернативными” технологиями для хранилищ данных (DWH), я решил посмотреть на СУБД Vertica Analytical Database компании Vertica Systems. Вашему вниманию предлагаются основные моменты, которые я почерпнул из документов, предоставленных компанией.

Общая информация

Компания Vertica Systems является производителем колоночной СУБД (columnar database) для хранилищ данных. Одним из основателей компании является Майк Стоунбрейкер (Stonebraker), что уже говорит о многом. Информация о продукте доступна на сайте компании. Прототипом для коммерческой СУБД Vertica послужила академическая СУБД C-Store, которая разрабатывалась под руководством Стоунбрейкера.

Продукт можно причислить к классу software only, но, как и в случае с другими вендорами этого класса, Vertica в партнёрстве с HP и Red Hat предлагают комплекс для хранилищ данных (data warehouse appliance). Помимо этого, Vertica в партнёрстве с Amazon предлагает свою СУБД в режиме cloud computing.
Читать дальше »

Опубликовано 11.03.2009 | Автор сообщения Константин Лисянский | Категории: Cloud computing, DWH, MPP, MapReduce, RDF, Vertica, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, Лисянский, Константин, На русском, Руководитель подразделения BI/DWH Комментариев 6

Моё знакомство с Aster Data

Автор: Константин Лисянский

Немного поближе познакомившись с технологиями DATAllegro и Greenplum я решил продолжить знакомство с “альтернативными” технологиями для хранилищ данных (DWH). В этот раз такой технологией стала технология Aster nCluster компании Aster Data.

Общая информация

Компания Aster Data Systems является производителем СУБД для хранилищ данных под названием Aster nCluster. Основали компанию сравнительно недавно три выпускника Стэндфордского университета, которые специализировались на параллельных вычислениях.

Проукт пока не попал в магический квадрат Gartner, однако, они упоминают о нём (обещают наблюдать за ним в течение 2009 года).
Читать дальше »

Опубликовано 04.03.2009 | Автор сообщения Константин Лисянский | Категории: Aster Data, Cloud computing, DWH, MPP, MapReduce, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, Лисянский, Константин, На русском, Руководитель подразделения BI/DWH

Моё знакомство с Greenplum

Автор: Константин Лисянский

Немного познакомившись с технолоией DATAllegro я решил посмотреть на одного из их конкурентов - Greenplum.

Информация об этом производителе присутствует ограниченно на нашем сайте, в основном, в статьях Курта Монаша. Поэтому я решил составить своё (пока поверхностное) мнение о их продукте.

Общая информация

Компания Greenplum является производителем СУБД для хранилищ данных под названием Greenplum Database.

Gartner позиционирует Greenplum как Visionary.
Читать дальше »

Опубликовано 27.02.2009 | Автор сообщения Константин Лисянский | Категории: DATAllegro, DWH, Greenplum, MPP, MapReduce, Open Source, Teradata, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, Лисянский, Константин, На русском, Руководитель подразделения BI/DWH

Моё знакомство с DATAllegro

Автор: Константин Лисянский

В силу жизненных обстоятельств появилось немного свободного времени, и я решил немного времени потратить на изучение продукта DATAllegro - его прошлого и потенциального будущего в виде проекта Madison компании Microsoft.

Общая информация

Начнём с того, что DATAllegro - это комплекс для хранилищ данных (data warehouse appliance), то есть комбинация аппаратного и программного обеспечения, предназначенная для решения специализированных задач - в данном случае, выступать в качестве платформы для хранилищ данных (DWH).

Это продукт одноимённой компании (которая в прошлом году была приобретена Microsoft, но об этом позднее).
Читать дальше »

Опубликовано 25.02.2009 | Автор сообщения Константин Лисянский | Категории: DATAllegro, DWH, EMC, MPP, Microsoft, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, Лисянский, Константин, На русском, Руководитель подразделения BI/DWH, Технический архитектор Комментариев 2

Краткое представление технологии Exasol

Автор: Curt Monash
Дата публикации оригинала: 2008-08-16
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

После моего представления Exasol нетехнического характера у меня на это ушло 5 ½ месяцев, но, наконец, я получил информацию от технических специалистов Exasol (в частности, самую полезную помощь оказали Матиас Голомбек (Mathias Golombek) и Карстен Вейдманн (Carsten Weidmann)). Вот некоторые основные моменты:

Сравнение/контраст между Vertica, ParAccel и Exasol

Автор: Curt Monash
Дата публикации оригинала: 2008-08-12
Источник: Блог Курта Монаша

Сегодня я общался с Exasol – в 5:00 утра! — и, конечно же, хочу написать об этом. Для внесения ясности, я хотел бы начать со сравнения/контраста между фундаментальными структурами данных в Vertica, ParAccel и Exasol. И, чувствуется, что это должно быть отдельным постом. Так что вот. Читать дальше »

Опубликовано 06.11.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Exasol, MPP, Monash, Curt, ParAccel, Vertica, itblogs, Архитектор BI, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH

Несколько тезисов о MapReduce

Автор: Curt Monash
Дата публикации оригинала: 2008-08-25
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

В прошлый четверг (статья написана 25 августа с.г.- прим. переводчика) как Greenplum, так и Aster Data, два самых последних из моих многочисленных клиентов – поставщиков систем для хранилищ данных, сообщили мне об одной и той же новинке в их продуктах. Оба же поторопились объявить об этом первыми, перед тем, как это сделает кто-то другой. Это привело к немалому числу дипломатических маневров; в результате дело кончилось тем, что обе компании выпустят информацию о нововведении сегодня вечером или завтра утром.

Дело в том, что Aster Data и Greenplum обе интегрировали MapReduce в свои СУБД, построенные на основе массивно-параллельной архитектуры без разделения ресурсов. Я вскоре напишу об этом подробнее, но пока позвольте мне «набросать» несколько тезисов перед тем, как последует более детальный анализ:

Читать дальше »

Опубликовано 03.11.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, DWH, Greenplum, MPP, MapReduce, Monash, Curt, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Оценивая КПД системы хранения: какую долю объема системы хранения занимают данные пользователя

Автор: Curt Monash
Дата публикации оригинала: 2008-09-01
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Существует немало путаницы по поводу того, как определять размер хранилища данных. Основными осложняющими факторами являются:

Итак, что означает Oracle Exadata для платформы HP Neoview?

Автор: Curt Monash
Дата публикации оригинала: 2008-09-26
Источник: Блог Курта Монаша

Кажется очевидным то, что компания HP серьезно относится к продажам большого количества аппаратного обеспечения для хранилищ данных в принципе, и, возможно, комплексов для хранилищ данных, в частности, подтверждением чему становится то, что:

  • HP стала купила большую консалтинговую практику по BI/хранилищам данных в Найсбридже.
  • HP вложила значительные средства в комплекс для хранилищ данных Neoview.
  • Исполнительный директор компании HP Марк Хёрд ранее работал в компании-поставщике комплексов для хранилищ данных Teradata.
  • В вопросе организации хранилищ данных замешаны большие деньги.

Но, Oracle Exadata мог бы осуществлять продажи данных устройств. Так, где же место для HP Neoview?
Читать дальше »

Опубликовано 09.10.2008 | Автор сообщения Константин Лисянский | Категории: DWH, HP Neoview, MPP, Monash, Curt, Netezza, Oracle, Oracle Exadata, Teradata, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH

Разделение нагрузки между узлами MPP-систем хранилищ данных

Автор: Curt Monash
Дата публикации оригинала: 2008-09-05
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Я общаюсь со многими поставщиками СУБД, которые созданы для систем с массивно-параллельной обработкой (MPP-системы) и которые используются для построения хранилищ данных. Мне рассказали о весьма разных подходах к реализации архитектуры MPP, и мне кажется, что было бы интересным сравнить некоторые из них.

В базовом варианте архитектуры таких СУБД имеются два типа узлов: Читать дальше »

Опубликовано 02.10.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, Calpont, DWH, Exasol, Greenplum, MPP, Monash, Curt, Netezza, Vertica, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор