The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd Edition

Ralph Kimball, Margy Ross

The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd EditionОчень хорошее введение в технологию многомерного моделирования.
Если вы собираетесь заниматься хранилищами данных (DWH), особенно если вы являетесь разработчиком моделей данных (data modeler) или архитектором хранилищ данных (data warehouse architect), эта книга для вас. Автор книги - известный практик в области хранилищ данных, и ему есть о чем рассказать о технолгии построения многомерных моделей (multidimensional model). Однако, имейте в виду, что монета имеет две стороны, и в случае с хранилищем данных это высказывание имеет силу.
Читать дальше »

Опубликовано 27.02.2009 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, DWH, Kimball, Ralph, Ross, Margy, Архитектор BI, Архитектор ETL, Архитектор данных, Для начинающих, Для продвинутых, Для экспертов, Книги, На английском, Проектирование многомерных моделей, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Специалист по обучению

The Data Warehouse Lifecycle Toolkit

Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite

The Data Warehouse ToolkitХорошая книга для начала изучения хранилищ данных.
Эта книга даст вам понимание того, что нужно иметь в виду при построении хранилища данных. Она будет полезна как начинающим, так и специалистам, уже занимающимся хранилищами данных. Усилия по сбору информации в одно издание заслуживает уважения. Главы о многомерном моделировании очень хороши (автор является известным популяризатором данного подхода к моделированию). CD-ROM, который продается в комплекте с книгой, содержит много полезной информации, которая поможет вам сэкономить много времени, если ваш проект создается с нуля.
Читать дальше »

Опубликовано 20.05.2008 | Автор сообщения Константин Лисянский | Категории: Becker, Bob, Kimball, Ralph, Ross, Margy, Thornthwaite, Warren, Архитектор BI, Архитектор ETL, Архитектор данных, Бизнес-аналитик, Ведущий тестировщик, Для начинающих, Для продвинутых, Для экспертов, Другие авторы, Книги, Менеджер метаданных, На английском, Проектирование многомерных моделей, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель проекта, Специалист data mining, Специалист по обучению, Стюард данных

Совет №64. Избегайте изоляции подразделения DW/BI

Дата публикации оригинала: 2005-02-08
Автор оригинала: Margy Ross
Перевод на русский язык: Олег Кузьменко
Оригинальный документ располагается здесь

Наверное, это просто совпадение, но в последнее время несколько человек задали мне схожий вопрос: «Следует ли командам хранилищ данных (DW) или business intelligence (BI) собирать требования от бизнеса?». Честно говоря, у меня волосы встают дыбом от такой постановки вопроса. Я обеспокоена тем фактом, что слишком много организаций чересчур обособили свои подразделения DW/BI.

Конечно, до некоторой степени это разграничение является естественным, особенно когда ресурсы, отведенные на DW/BI, растут по мере расширения инфраструктуры, создавая очевидные проблемы с нормой управляемости (наиболее простое определение этого термина: количество прямых подчинённых у одного менеджера - прим. переводчика). Также разделение труда позволяет специализацию. Если провести аналогию между инфраструктурой DW/BI и рестораном, то можно сказать, что некоторые члены команды чрезвычайно искусны в приготовлении блюд на кухне, в то время как другие очень заботливы и внимательны по отношению к клиентам, обеспечивая тем самым их повторный визит. Существует, насколько можно ожидать, немного официантов, которым вдруг следует облачиться в одеяния шеф-повара, и наоборот.

Читать дальше »

Опубликовано 19.05.2008 | Автор сообщения Олег Кузьменко | Категории: Ross, Margy, Бизнес-аналитик, Для продвинутых, На русском, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Советы разработчику ХД

Совет №54. Реализация двух перспектив: исторической и текущей

Как и многое в нашей жизни, перемены неизбежны в атрибутах измерения. Большинство читателей Советов Разработчику хорошо знакомы с тремя базовыми техниками медленно меняющихся измерений (SCD):

Тип 1: Переписать атрибут заново.

Тип 2: Добавить еще одну запись в измерение

Тип 3: Добавить еще один атрибут

Читать дальше »

Опубликовано 07.05.2008 | Автор сообщения Антон Задорожный | Категории: Ross, Margy, Для продвинутых, Проектирование многомерных моделей, Разработчик моделей данных, Разработчик приложений BI, Советы разработчику ХД

Slowly Changing Dimensions Are Not Always as Easy as 1, 2, 3

В статье рассказывается о различных гибридных медленно изменяющихся измерениях (комбинирование типов SCD 1, 2 и 3). Читать статью…

Опубликовано 20.04.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Ross, Margy, Для экспертов, Проектирование многомерных моделей

Совет №69. Идентифицируем бизнес-процессы

Читатели, следующие подходу Кимбала, легко могут перечислить 4 ключевых решения, принимаемых при проектировании многомерной модели: определить бизнес-процесс, гранулярность, измерения и показатели. По правде говоря, разработчики часто спотыкаются уже на первом шаге. Они прикладывают значительные усилия для ясного формулирования бизнес-процесса, потому что сам по себе этот термин меняет значение в зависимости от контекста. Поскольку определение бизнес-процесса является первым кирпичом в фундаменте правильной многомерной модели, то хотелось бы устранить все неясности в нашем определении этого понятия.

Читать дальше »

Опубликовано 16.04.2008 | Автор сообщения Егор Демьянов | Категории: Ross, Margy, Бизнес-аналитик, Для экспертов, Разработчик моделей данных, Руководитель проекта от бизнеса, Советы разработчику ХД

Совет №49. Со скамьи

В последнем номере журнала Intelligent Enterprise от 17 сентября опубликована статья под названием The Bottom-Up Misnomer. Мы с Ральфом написали эту статью несколько месяцев назад. Пока она проходила по издательскому конвейеру, отраслевое новостное письмо ещё сильнее подогрело дискуссию подход «снизу вверх» против подхода «сверху вниз». Похоже, многие чувствуют, что они могут объяснить подход Кимбалла. К сожалению, иногда они распространяют непонимание и продолжают затуманивать проблемы. Хоть мы точно и не являемся экспертным источником детального объяснения подхода корпоративной информационной фабрики (corporate information factory – CIF), мы чувствуем ответственность в том, чтобы внести ясность относительно наших методов, а не наблюдать со стороны.

Читать дальше »

Опубликовано 16.04.2008 | Автор сообщения Константин Лисянский | Категории: Ross, Margy, Для экспертов, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Советы разработчику ХД

Совет №48. Наводим порядок с помощью «мусорных» измерений

При проектировании многомерных моделей мы часто сталкиваемся с различными индикаторами или флагами, не являющимися атрибутами основных измерений. Обычно эти несвязанные атрибуты достаточно важны, и мы не можем их просто проигнорировать или исключить. Проектировщики иногда трактуют их как текстовые факты, либо загромождают модель множеством маленьких измерений. Третий, менее очевидный, но более предпочтительный способ заключается в том, чтобы использовать «мусорное» измерение (junk dimension) для хранения этих флагов и индикаторов.

Мусорное измерение весьма удобно для группировки флагов и индикаторов, особенно в случае значительной корреляции между их значениями. Преимущества от использования мусорных измерений следующие: Читать дальше »

Опубликовано 16.04.2008 | Автор сообщения Егор Демьянов | Категории: Ross, Margy, Для продвинутых, Проектирование многомерных моделей, Разработчик моделей данных, Разработчик приложений BI, Советы разработчику ХД

Совет №41. Погружаемся в более детальную матрицу шины хранилища данных

Многие из вас уже знакомы с тем, какую важную роль играют шина хранилища данных (the data warehouse bus architecture) и матрица шины при построении витрин данных. Статья Ральфа в Intelligent Enterprise еще раз подчеркивает важность использования шины хранилища данных. Матрица шины определяет ключевые бизнес-процессы организации и связанные с ними измерения. Бизнес-процессы (обычно соответствующие основным системам-источникам) перечислены в строках матрицы, а измерения представлены столбцами. Затем ячейки матрицы помечаются для указания того, какие измерения применяются к каким процессам.

Читать дальше »

Опубликовано 16.04.2008 | Автор сообщения Егор Демьянов | Категории: Ross, Margy, Архитектор BI, Бизнес-аналитик, Для продвинутых, Проектирование многомерных моделей, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Советы разработчику ХД

Совет №36. Быть или не быть (централизации)

В отличие от Шекспира и некоторых «экспертов» по хранилищам данных, для нас в этом НЕТ вопроса.
В этой статье мы обсудим проблемы, с которыми сталкиваются «взрослеющие» витрины/хранилища данных. В то время как некоторые организации только начинают интересоваться хранилищами данных, другие уже достаточно долго используют их. По мере становления отрасли, причины основных проблем, связанных с хранилищами данных, эволюционируют. В последнее время централизация позиционируется как некий волшебный эликсир. Утверждается, что централизация способна превратить разрозненные витрины данных в «золото» путем уменьшения затрат и увеличения производительности. Хотя централизация и может привести к более эффективной эксплуатации, она, по сути, не решает более важных проблем интеграции и согласованности данных.
Читать дальше »

Опубликовано 15.04.2008 | Автор сообщения Егор Демьянов | Категории: Becker, Bob, Ross, Margy, Архитектор BI, Архитектор ETL, Для продвинутых, На русском, Разработчик BI-портала, Руководитель подразделения BI/DWH, Советы разработчику ХД