Fundamental Grains

Дата публикации оригинала - 1999-03-30

В этой статье Ральф Кимбалл рассказывает о трёх базовых типах таблиц фактов - транзакционная, накопительный снимок, периодический снимок. Кратко рассматривается их отношение ко времени, а также область применения каждого из этих типов.

Читать статью…

Опубликовано 28.05.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Архитектор BI, Для начинающих, На английском, Проектирование многомерных моделей, Разработчик моделей данных, Разработчик приложений BI

Aggregate Navigation With (Almost) No Metadata

В этой статье Ральф Кимбалл описывает цели и риски программы по построению агрегированной схемы, приводит четыре требования к её проектированию, а также объясняет принципы действия навигации по агрегатам.

Читать статью…

Опубликовано 26.05.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Архитектор BI, Архитектор ETL, Для начинающих, На английском, Проектирование многомерных моделей, Работа с агрегатами, Разработчик ETL, Разработчик приложений BI

Backward in Time

Ральф Кимбалл рассматривает два случая, когда данные приходят в хранилище данных с запозданием.

Читать статью…

Опубликовано 25.05.2008 | Автор сообщения Константин Лисянский | Категории: ETL, Kimball, Ralph, Архитектор BI, Архитектор ETL, На английском, Разработчик ETL

The Aggregate Navigator. How to optimize your data warehouse using aggregates without driving your end users crazy

Пожалуй, самая старая статья по агрегатным навигаторам (aggregate navigator). Статья описывает, что такое агрегатный навигатор, какие проблемы он призван решать и какие существуют реализации.
Повторюсь, статья старая, по этой теме нужно читать что-то ещё, чтобы овладеть предметом более глубоко.

Читать статью…

Опубликовано 22.05.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Архитектор BI, Для начинающих, На английском, Работа с агрегатами, Разработчик приложений BI

The Data Warehouse Lifecycle Toolkit

The Data Warehouse Toolkit

Авторы: Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite

Хорошая книга для начала изучения хранилищ данных.
Эта книга даст вам понимание того, что нужно иметь в виду при построении хранилища данных. Она будет полезна как начинающим, так и специалистам, уже занимающимся хранилищами данных. Усилия по сбору информации в одно издание заслуживает уважения. Главы о многомерном моделировании очень хороши (автор является известным популяризатором данного подхода к моделированию). CD-ROM, который продается в комплекте с книгой, содержит много полезной информации, которая поможет вам сэкономить много времени, если ваш проект создается с нуля.
Тем не менее, после того, как вы прочитаете эту книгу, вам придётся поискать специализированные книги, посвященные различным аспектам построения хранилища данных, таким, например, как управление метаданными и управление качеством данных, поскольку они слабо освещены в книге. Я бы дал этой книге пять звездочек, если бы в ней не присутствовала явная агрессивность в отношении моделирования сущность-связь, которое, как я полагаю, имеет свое место в среде хранилищ данных.


Купить книгу на Amazon.com

А, вот это второе издание этой книги, вышедшее в январе 2008 года.

The Data Warehouse Lifecycle Toolkit, 2nd Edition

Авторы: Ralph Kimball, Margy Ross, Warren Thorntwaite, Joy Mundy, Bob Becker

Я пока её не прочитал - заказал, получил и поставил в очередь на чтение. Прочитаю, отпишу. Если кто-то уже прочитал, просьба поделиться своими мыслями.


Купить второе издание на Amazon.com

Опубликовано 20.05.2008 | Автор сообщения Константин Лисянский | Категории: Becker, Bob, Kimball, Ralph, Mundy, Joy, Reevs, Laura, Ross, Margy, Thornthwaite, Warren, Архитектор BI, Архитектор ETL, Архитектор данных, Бизнес-аналитик, Ведущий тестировщик, Для начинающих, Для продвинутых, Для экспертов, Книги, Менеджер метаданных, На английском, Проектирование многомерных моделей, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель проекта, Специалист data mining, Специалист по обучению, Стюард данных

Dealing With Dirty Data

Дата публикации оригинала: 1996-09

В этой краткой статье известный практик в области хранилищ данных Ральф Кимбалл приводит примеры приложений, в которых чистота данных имеет принципиальное значение. Он рассказывает о шести типичных шагах процесса очистки данных. Проводится краткий обзор рынка продуктов по очистке данных и наиболее ярких его представителей. Показывается, что требования целостности данных обуславливают необходимость реинженеринга бизнес-процессов.

Статья довольно старая, поэтому список производителей неактуален. С теоретической частью можно познакомиться.

Читать статью…

Опубликовано 15.05.2008 | Автор сообщения Константин Лисянский | Категории: Data Quality, ETL, Kimball, Ralph, Аналитик качества данных, Архитектор ETL, Для начинающих Комментариев 2

Совет №59. Удивительная польза профилирования данных

Дата оригинальной публикации: 2004-09-14
Автор оригинала: Ralph Kimball
Перевод на русский язык: Антон Задорожный
Оригинальный документ располагается здесь

Профилирование данных это серая лошадка технологий хранилищ данных. Мне кажется что большинство из нас думает о профилировании данных, как о чем-то, что вы делаете после того как была построена система ETL. В этом представлении,   профилирование отыскивает небольшие аномалии, что могут потребовать очистки перед загрузкой данных в промышленную среду. Обнаружение этих аномалий перед переходом в промышленную среду должно предохранить команду разработчиков хранилища данных от маленьких сюрпризов.

В последние годы, при работе над новой книгой об ETL с Joe Caserta я глубоко погружался в детали ETL процессов, необходимых для построения хранилища данных. Возможно самым большим откровением было открытие степени недооценки профилирования данных в типичном проекте по созданию хранилища.

Что такое профилирование данных?

Читать дальше »

Опубликовано 14.05.2008 | Автор сообщения Антон Задорожный | Категории: Data Quality, Kimball, Ralph, Аналитик качества данных, Архитектор BI, Архитектор ETL, Для продвинутых, Разработчик BI-портала, Разработчик ETL, Советы разработчику ХД, Стюард данных

Meta Meta Data Data

В своей статье Ральф Кимбалл приводит обширный список метаданных, которые необходимо иметь для обеспечения успешного проектирования, внедрения и эксплуатации хранилища данных. Также приведен список основных производителей программного обеспечения для управления метаданными.

Читать статью…

Опубликовано 05.05.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Архитектор BI, Архитектор ETL, Для начинающих, Менеджер метаданных, Разработчик BI-портала, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Стюард данных, Управление метаданными

Совет №65. Документируйте ETL-систему

Независимо от того, используете ли вы для ETL специализированные инструменты, или разрабатываете своими руками, ETL-система является таким же программным обеспечением, как и любое другое, и должна быть документирована. По мере развития самого хранилища данных, ETL-система развивается с ним в ногу. Вы и ваши коллеги должны иметь возможность быстро разобраться как в архитектуре системы, так и в мельчайших деталях.

Существует распространенный миф, что ETL-инструменты самодокументируются. Это верно только в сравнении с самописными системами. Не верьте этому! Всегда нужно проектировать архитектуру ETL-системы. И всегда нужно документировать эту систему. Да, нужно писать документ.

Читать дальше »

Опубликовано 04.05.2008 | Автор сообщения Егор Демьянов | Категории: ETL, Kimball, Ralph, Архитектор ETL, Для начинающих, Разработчик ETL, Руководитель проекта, Советы разработчику ХД

The Anti-Architect

12 основных ошибок по Ральфу Кимбаллу, которых следует избегать при построении хранилища данных

Читать статью…

Опубликовано 04.05.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Для начинающих, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса