Infobright раскрывает свой код

Автор: Curt Monash
Дата публикации оригинала: 2008-09-15
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

По своему недавно появившемуся обыкновению, при появлении какой-либо новости в индустрии я привожу ее краткий, тезисный анализ. Сегодня я делаю это по поводу Infobright и их перехода на стратегию открытого исходного кода. Если позволит погода, то после полудня я вылечу на конференцию Netezza (статья написана 15 сентября с.г.- прим. переводчика). И с четверга у меня было только 10 часов для сна. Поэтому я надеюсь, что этих тезисов будет достаточно, хотя, если это окажется не так, и вы мне напишите, то я попытаюсь ответить не позже утра вторника.

Читать дальше »

Опубликовано 18.11.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, DATAllegro, DWH, Greenplum, Infobright, Monash, Curt, MySQL, Netezza, Open Source, ParAccel, Teradata, Vertica, itblogs, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Последние новости о Infobright

Автор: Curt Monash
Дата публикации оригинала: 2008-09-15
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

В связи с объявлением того, что:

  • Компания Infobright открывает исходный код своей аналитической СУБД (что является действительно хорошей идеей)
  • Infobright получила 10 миллионов долларов США от пары венчурных фондов и компании Sun

я публикую первый с января обзор новостей по Infobright (статья написана 15 сентября с.г.- прим. переводчика). Вот основные моменты:

Читать дальше »

Опубликовано 14.11.2008 | Автор сообщения Олег Кузьменко | Категории: DWH, Infobright, Monash, Curt, MySQL, Open Source, itblogs, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH

Netezza и Teradata в управлении аналитическими геопространственными данными

Автор: Curt Monash
Дата публикации оригинала: 2008-09-26
Источник: Блог Курта Монаша

Управление геопространственными данными является хитом сезона:

Итак, я задал вопросы компаниям Netezza и Teradata об анализе геопространственных данных.
Читать дальше »

Опубликовано 12.11.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Geospatial, Monash, Curt, Netezza, Teradata, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH

Даешь свободу выбора СУБД!

Автор: Curt Monash
Дата публикации оригинала: 2008-08-20
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Если и есть одна центральная тема, которой придерживается блог DBMS2, так это то, что во многих случаях вместо традиционных СУБД-лидеров можно использовать современные «альтернативные» СУБД. Так что это было лишь вопросом времени, пока кто-то не спонсировал доклад-исследование на эту тему. Доклад, спонсированный компанией EnterpriseDB, размещен вместе с моими другими недавними докладами. Его заключительная часть, резюмирующая то, какой тип СУБД вам следует использовать при каких обстоятельствах, воспроизведена ниже.

Читать дальше »

Опубликовано 11.11.2008 | Автор сообщения Олег Кузьменко | Категории: Business Intelligence, DWH, EnterpriseDB, Monash, Curt, Oracle, itblogs, Администратор БД, Архитектор BI, Для начинающих, Для продвинутых, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Что думает о твердотельных накопителях Карсон Шмидт из компании Teradata

Автор: Curt Monash
Дата публикации оригинала: 2008-10-23
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Карсон Шмидт (Carson Schmidt) является вице-президентом компании Teradata, отвечающим за разработку всего, что не относится к приложениям или ПО баз данных. Например, он курирует серверы, системы хранения и технологию коммутации Teradata. Поэтому когда у Скотта Гнау (Scott Gnau), исполнительного директора по разработке компании Teradata, не нашлось ответов на некоторые вопросы по поводу твердотельных накопителей (solid-state drives или SSD), он переадресовал меня к Карсону. В результате состоялся очень интересный разговор, посвященный твердотельным накопителям и другим вопросам.

Вот некоторые основные моменты этой беседы:

Читать дальше »

Опубликовано 09.11.2008 | Автор сообщения Олег Кузьменко | Категории: DWH, Monash, Curt, Teradata, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Известные области применения MapReduce

Автор: Curt Monash
Дата публикации оригинала: 2008-08-26
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Большинство существующих сфер использования MapReduce, о которых я слышал, попадают в одну из следующих категорий:

  • Выделение токенов из текста, индексирование и поиск по тексту
  • Создание других структур данных (например, графов)
  • Data mining и обучение машин

Этот список покрывает все области применения MapReduce, о которых, помнится, я слышал от компаний и пользователей, и он также содержит большинство тех приложений, которые я нашел в двух больших источниках в Интернете, а именно:

1. В своей презентации Google рассказывает о следующих задачах, для которых может быть применен MapReduce:

Читать дальше »

Опубликовано 07.11.2008 | Автор сообщения Олег Кузьменко | Категории: MapReduce, Monash, Curt, itblogs, Для продвинутых, Для экспертов, На русском, Разработчик приложений BI, Руководитель подразделения BI/DWH, Специалист data mining, Технический архитектор

Сравнение/контраст между Vertica, ParAccel и Exasol

Автор: Curt Monash
Дата публикации оригинала: 2008-08-12
Источник: Блог Курта Монаша

Сегодня я общался с Exasol – в 5:00 утра! — и, конечно же, хочу написать об этом. Для внесения ясности, я хотел бы начать со сравнения/контраста между фундаментальными структурами данных в Vertica, ParAccel и Exasol. И, чувствуется, что это должно быть отдельным постом. Так что вот. Читать дальше »

Опубликовано 06.11.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Exasol, MPP, Monash, Curt, ParAccel, Vertica, itblogs, Архитектор BI, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH

Несколько тезисов о MapReduce

Автор: Curt Monash
Дата публикации оригинала: 2008-08-25
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

В прошлый четверг (статья написана 25 августа с.г.- прим. переводчика) как Greenplum, так и Aster Data, два самых последних из моих многочисленных клиентов – поставщиков систем для хранилищ данных, сообщили мне об одной и той же новинке в их продуктах. Оба же поторопились объявить об этом первыми, перед тем, как это сделает кто-то другой. Это привело к немалому числу дипломатических маневров; в результате дело кончилось тем, что обе компании выпустят информацию о нововведении сегодня вечером или завтра утром.

Дело в том, что Aster Data и Greenplum обе интегрировали MapReduce в свои СУБД, построенные на основе массивно-параллельной архитектуры без разделения ресурсов. Я вскоре напишу об этом подробнее, но пока позвольте мне «набросать» несколько тезисов перед тем, как последует более детальный анализ:

Читать дальше »

Опубликовано 03.11.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, DWH, Greenplum, MPP, MapReduce, Monash, Curt, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Странная статья о Sybase IQ и колоночных СУБД

Автор: Curt Monash
Дата публикации оригинала: 2008-04-04
Источник: Блог Курта Монаша

В Intelligent Enterprise есть статья о Sybase IQ и колоночных СУБД, которая заставляет меня покачать головой. Например, она заканчивается словами о том, что у Netezza колоночная архитектура (о, нет). Она также цитирует топ-менеджера из IBM, который говорит, что производительность это только 10-20% из того, что имеет значение в СУБД для хранилищ данных (уже довольно странное заявление), а затем приписывают ему слова о том, что хранение данных по колонкам даёт прирост производительности всего на 10% (давайте проявим снисхождение и будем надеяться, что это ошибочное цитирование).
Читать дальше »

Опубликовано 31.10.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Monash, Curt, Sybase, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Оценивая КПД системы хранения: какую долю объема системы хранения занимают данные пользователя

Автор: Curt Monash
Дата публикации оригинала: 2008-09-01
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Существует немало путаницы по поводу того, как определять размер хранилища данных. Основными осложняющими факторами являются: