Совет №59. Удивительная польза профилирования данных
Дата оригинальной публикации: 2004-09-14
Автор оригинала: Ralph Kimball
Перевод на русский язык: Антон Задорожный
Оригинальный документ располагается здесь
Профилирование данных это серая лошадка технологий хранилищ данных. Мне кажется что большинство из нас думает о профилировании данных, как о чем-то, что вы делаете после того как была построена система ETL. В этом представлении, профилирование отыскивает небольшие аномалии, что могут потребовать очистки перед загрузкой данных в промышленную среду. Обнаружение этих аномалий перед переходом в промышленную среду должно предохранить команду разработчиков хранилища данных от маленьких сюрпризов.
В последние годы, при работе над новой книгой об ETL с Joe Caserta я глубоко погружался в детали ETL процессов, необходимых для построения хранилища данных. Возможно самым большим откровением было открытие степени недооценки профилирования данных в типичном проекте по созданию хранилища.
Что такое профилирование данных?
Опубликовано 14.05.2008 | Автор сообщения Антон Задорожный | Категории: Data Quality, Kimball, Ralph, Аналитик качества данных, Архитектор BI, Архитектор ETL, Для продвинутых, Разработчик BI-портала, Разработчик ETL, Советы разработчику ХД, Стюард данных