Отклонение бюджета – Изучение оптимизаций MDX: режимы оценки и NON_EMPTY_BEHAVIOR

Автор: Mosha Pasumansky
Дата публикации оригинала: 2006-11-05
Перевод: Андрей Бабуров
Источник: Блог Mosha Pasumansky

Самое главное при построении OLAP систем – это быстродействие. Это подтверждают разные сообщения в новостных группах и форумах. Можно сказать, что наиболее частый вопрос, который задают люди – «Как оптимизировать следующий MDX…». Оптимизация MDX – это и наука и искусство. Она требует смесь знаний конструкций MDX, знакомство с концепцией UDM и некоторое базовое понимание того, как работает оптимизатор запросов. Но самым сложным я нахожу понимание реальной проблемы, скрывающейся за вопросом. Большинство из них требуют глубокого погружения в конкретную модель и хорошие знания бизнес логики и требований. Часто эти детали делают настолько неясными технические вопросы, что никто сразу не предложит правильного решения (конечно, если я не понимаю вопрос после прочтения, то вряд ли включусь в обсуждение) или начнется длительное обсуждение, которое обрастет дополнительными деталями и уточнениями. И в конце, даже если ответ правильный и улучшает производительность, то все равно не просто уловить суть идеи оптимизации и обобщить ее для использования в других случаях. Читать дальше »

Опубликовано 20.11.2008 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, MDX, Microsoft, OLAP, Pasumansky, Mosha, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, На русском, Разработчик приложений BI

Infobright раскрывает свой код

Автор: Curt Monash
Дата публикации оригинала: 2008-09-15
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

По своему недавно появившемуся обыкновению, при появлении какой-либо новости в индустрии я привожу ее краткий, тезисный анализ. Сегодня я делаю это по поводу Infobright и их перехода на стратегию открытого исходного кода. Если позволит погода, то после полудня я вылечу на конференцию Netezza (статья написана 15 сентября с.г.- прим. переводчика). И с четверга у меня было только 10 часов для сна. Поэтому я надеюсь, что этих тезисов будет достаточно, хотя, если это окажется не так, и вы мне напишите, то я попытаюсь ответить не позже утра вторника.

Читать дальше »

Опубликовано 18.11.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, DATAllegro, DWH, Greenplum, Infobright, Monash, Curt, MySQL, Netezza, Open Source, ParAccel, Teradata, Vertica, itblogs, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Последние новости о Infobright

Автор: Curt Monash
Дата публикации оригинала: 2008-09-15
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

В связи с объявлением того, что:

  • Компания Infobright открывает исходный код своей аналитической СУБД (что является действительно хорошей идеей)
  • Infobright получила 10 миллионов долларов США от пары венчурных фондов и компании Sun

я публикую первый с января обзор новостей по Infobright (статья написана 15 сентября с.г.- прим. переводчика). Вот основные моменты:

Читать дальше »

Опубликовано 14.11.2008 | Автор сообщения Олег Кузьменко | Категории: DWH, Infobright, Monash, Curt, MySQL, Open Source, itblogs, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH

Netezza и Teradata в управлении аналитическими геопространственными данными

Автор: Curt Monash
Дата публикации оригинала: 2008-09-26
Источник: Блог Курта Монаша

Управление геопространственными данными является хитом сезона:

Итак, я задал вопросы компаниям Netezza и Teradata об анализе геопространственных данных.
Читать дальше »

Опубликовано 12.11.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Geospatial, Monash, Curt, Netezza, Teradata, itblogs, Архитектор BI, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH

Что думает о твердотельных накопителях Карсон Шмидт из компании Teradata

Автор: Curt Monash
Дата публикации оригинала: 2008-10-23
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Карсон Шмидт (Carson Schmidt) является вице-президентом компании Teradata, отвечающим за разработку всего, что не относится к приложениям или ПО баз данных. Например, он курирует серверы, системы хранения и технологию коммутации Teradata. Поэтому когда у Скотта Гнау (Scott Gnau), исполнительного директора по разработке компании Teradata, не нашлось ответов на некоторые вопросы по поводу твердотельных накопителей (solid-state drives или SSD), он переадресовал меня к Карсону. В результате состоялся очень интересный разговор, посвященный твердотельным накопителям и другим вопросам.

Вот некоторые основные моменты этой беседы:

Читать дальше »

Опубликовано 09.11.2008 | Автор сообщения Олег Кузьменко | Категории: DWH, Monash, Curt, Teradata, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Известные области применения MapReduce

Автор: Curt Monash
Дата публикации оригинала: 2008-08-26
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Большинство существующих сфер использования MapReduce, о которых я слышал, попадают в одну из следующих категорий:

  • Выделение токенов из текста, индексирование и поиск по тексту
  • Создание других структур данных (например, графов)
  • Data mining и обучение машин

Этот список покрывает все области применения MapReduce, о которых, помнится, я слышал от компаний и пользователей, и он также содержит большинство тех приложений, которые я нашел в двух больших источниках в Интернете, а именно:

1. В своей презентации Google рассказывает о следующих задачах, для которых может быть применен MapReduce:

Читать дальше »

Опубликовано 07.11.2008 | Автор сообщения Олег Кузьменко | Категории: MapReduce, Monash, Curt, itblogs, Для продвинутых, Для экспертов, На русском, Разработчик приложений BI, Руководитель подразделения BI/DWH, Специалист data mining, Технический архитектор

Сравнение/контраст между Vertica, ParAccel и Exasol

Автор: Curt Monash
Дата публикации оригинала: 2008-08-12
Источник: Блог Курта Монаша

Сегодня я общался с Exasol – в 5:00 утра! — и, конечно же, хочу написать об этом. Для внесения ясности, я хотел бы начать со сравнения/контраста между фундаментальными структурами данных в Vertica, ParAccel и Exasol. И, чувствуется, что это должно быть отдельным постом. Так что вот. Читать дальше »

Опубликовано 06.11.2008 | Автор сообщения Константин Лисянский | Категории: DWH, Exasol, MPP, Monash, Curt, ParAccel, Vertica, itblogs, Архитектор BI, Для продвинутых, Для экспертов, Колоночные СУБД, На русском, Руководитель подразделения BI/DWH

SSAS: процессинг, ForceCommitTimeout и “the operation has been cancelled”

Автор: Darren Gosbell
Дата публикации оригинала: 2007-04-24
Источник: Блог Darren Gosbell

В этой статье представлено кое-что интересное, что стало недавно темой группы новостей, однако, тем не менее, я считаю необходимым разъяснить этот вопрос дополнительно.

Видели ли вы когда-либо ошибку «the operation has been cancelled» в длительных запросах (запросы, которые занимают более 30 секунд), в то время как куб или секция обрабатываются? Читать дальше »

Опубликовано 04.11.2008 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, Gosbell, Darren, MDX, Microsoft, OLAP, Для продвинутых, Для экспертов, На русском

Несколько тезисов о MapReduce

Автор: Curt Monash
Дата публикации оригинала: 2008-08-25
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

В прошлый четверг (статья написана 25 августа с.г.- прим. переводчика) как Greenplum, так и Aster Data, два самых последних из моих многочисленных клиентов – поставщиков систем для хранилищ данных, сообщили мне об одной и той же новинке в их продуктах. Оба же поторопились объявить об этом первыми, перед тем, как это сделает кто-то другой. Это привело к немалому числу дипломатических маневров; в результате дело кончилось тем, что обе компании выпустят информацию о нововведении сегодня вечером или завтра утром.

Дело в том, что Aster Data и Greenplum обе интегрировали MapReduce в свои СУБД, построенные на основе массивно-параллельной архитектуры без разделения ресурсов. Я вскоре напишу об этом подробнее, но пока позвольте мне «набросать» несколько тезисов перед тем, как последует более детальный анализ:

Читать дальше »

Опубликовано 03.11.2008 | Автор сообщения Олег Кузьменко | Категории: Aster Data, DWH, Greenplum, MPP, MapReduce, Monash, Curt, itblogs, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Vertica — только схемы «звезда» и «снежинка»?

Автор: Curt Monash
Дата публикации оригинала: 2007-10-23
Источник: Блог Курта Монаша

Один из наиболее долгоживущих технологических споров, о которых я знаю, это спор приверженцев нормализованных хранилищ данных с приверженцами кубов, схем «звезда» и «снежинка». Teradata, например, является флагманом первого лагеря; Microstrategy уверенно относится к последнему. (Однако это не удерживает множество розничных компаний от работы на Microstrategy поверх машин Teradata.) Attensity (хороший партнёр Teradata) принадлежит к первому лагерю; соперник по text mining компания Clarabridge (вроде бы, отпочковавшийся от Microstrategy) относится к последнему. И так далее.
Читать дальше »

Опубликовано 02.11.2008 | Автор сообщения Константин Лисянский | Категории: Monash, Curt, Vertica, Для начинающих, Для продвинутых, Для экспертов, Колоночные СУБД, На русском