Разгоняем хранилище данных (Часть 3)

В предыдущей статье были рассмотрены аппаратные и программные способы повышения производительности хранилищ данных (DWH). Сегодня рассмотрим архитектурные способы, проектирование и администрирование.

Архитектуные способы повышения производительности

Правильная архитектура имеет ключевое значение для производительности и пропускной способности всей системы в целом. Элементами архитектуры являются все системы, вовлечённые в наполнение и использование хранилища данных, начиная от систем-источников (source system), и заканчивая отдельными витринами данных (data mart) и аналитическими приложениями (analytical application). При правильно построенной архитектуре данные максимально быстро попадают из систем, в которых они создаются, к конечным пользователям. При этом инфраструктура хранилища данных (оборудование, программное обеспечение) используется наиболее оптмальным образом (отсутствуют пики и простои). Оптимизация хранилища данных с точки зрения архитектуры может включать перенос нагрузки из узких мест в более производительные и/или недозагруженные. Например, перенос части нагрузки с ETL-серверов на СУБД хранилища данных (ELT). Или, наоборот, разгрузка СУБД хранилища данных за счёт переноса нагрузки с СУБД на серверы OLAP.
Читать дальше »

Опубликовано 23.05.2009 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, DWH, ETL, Администратор БД, Архитектор BI, Архитектор ETL, Для продвинутых, Для экспертов, Лисянский, Константин, На русском, Разработчик ETL, Руководитель подразделения BI/DWH, Технический архитектор 1 комментарий

The Data Warehouse ETL Toolkit

Ralph Kimball, Joe Caserta

The Data Warehouse ETL ToolkitКнига известного популяризатора технологий хранилищ данных Ральфа Кимбала рассказывает о том, как построить систему ETL для хранилища данных, построенного на основе многомерной модели данных. В книге рассматриваются все аспекты, связанные с ETL, включая планирование, архитектуру, структуры и потоки данных, очистку данных и мониторинг качества данных, процессы разработки и оптимизации, поддержку ETL в режиме производственной эксплуатации, управление метаданными, зоны ответственности и процессы, извлечение и загрузку данных в режиме реального времени.
Читать дальше »

Опубликовано 07.05.2009 | Автор сообщения Константин Лисянский | Категории: Caserta, Joe, DWH, ETL, Kimball, Ralph, Архитектор ETL, Для начинающих, Для продвинутых, Для экспертов, На английском, Разработчик ETL

Разгоняем хранилище данных

Автор: Константин Лисянский

Рано или поздно все разработчики хранилищ данных (DWH) сталкиваются с проблемой производительности хранилища данных. В этой статье мне хочется вспомнить возможные способы повышения производительности подсистем хранилища данных и всего хранилища в целом.

Готовых советов о том, что делать, в этой статье не будет, я просто попытался вспомнить обо всех известных мне способах. Замечу также, что речь пойдёт и о способах ускорения, изначально заложенных в соответствующие программные продукты. Таким образом, я уделю немного внимания “встроенным” в разные СУБД средствам ускорения.

Для начала (поскольку способов вспомнилось, как ни странно, довольно много) хотелось бы предложить некоторую классификацию этих способов, а также перечислить те места, в которых можно ускорять.
Читать дальше »

Опубликовано 17.03.2009 | Автор сообщения Константин Лисянский | Категории: DWH, itblogs, Архитектор BI, Архитектор ETL, Для начинающих, Для продвинутых, Для экспертов, Лисянский, Константин, На русском, Разработчик ETL, Разработчик приложений BI, Руководитель подразделения BI/DWH Комментариев 3

The Microsoft Data Warehouse Toolkit: With SQL Server 2005 and the Microsoft Business Intelligence Toolset

Joy Mundy, Warren Thornthwaite, Ralph Kimball

The Microsoft Data Warehouse Toolkit: With SQL Server 2005 and the Microsoft Business Intelligence ToolsetОписание от издателя
Эта прорывная книга является первой из серии Kimball Toolkit, которая является продукто-ориентированной. Инструментарий BI от компании Microsoft претерпел значительные изменения при разработке SQL Server 2005. SQL Server 2005 - это первая жизнеспособная полноценная платформа для хранилищ данных (DWH) и business intelligence, которая предлагается по цене, делающей технологии хранилищ данных и business intelligence доступными широкому кругу организаций. Эта книга должна предложить практические методы и направить эти организации через мириады проблем к истинному успеху, который измеряется ценным вкладом в бизнес-результат.
Читать дальше »

Опубликовано 11.03.2009 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, DWH, ETL, Kimball, Ralph, Microsoft, Thornthwaite, Warren, Администратор БД, Архитектор BI, Архитектор ETL, Для начинающих, Для продвинутых, Для экспертов, Книги, На английском, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта

Building the Data Warehouse, 4th Edition

W. H. Inmon

Building the Data WarehouseНовое издание классического бестселлера, который послужил началом отрасли хранилищ данных.
Книга описывает новые подходы и технологии, во многих из которых пионером выступил сам Билл Инмон (Inmon). В дополнение к объяснению основ хранилищ данных (DWH), книга овещает новые темы, такие как методы обработки неструктурированных данных (unstructured data) и хранение данных в хранилище данных на нескольких типах носителей (multi-temperature data warehousing).

Книга обсуждает достоинства и недостатки реляционного и многомерного подходов к проектированию, а также то, как измерять возврат на инвестиции (ROI) при планировании проектов по построению хранилищ данных.
Читать дальше »

Опубликовано 04.03.2009 | Автор сообщения Константин Лисянский | Категории: DWH, Inmon, Bill, Аналитик качества данных, Архитектор BI, Архитектор ETL, Архитектор данных, Ведущий тестировщик, Для начинающих, Для продвинутых, Для экспертов, Книги, Менеджер метаданных, На английском, Проектирование нормализованных моделей, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Сравнение подходов проектирования, Стюард данных, Технический архитектор

Введение в системы баз данных

К. Дж. Дейт

Введение в системы баз данныхОт издателя
Новое издание фундаментального труда Криса Дейта представляет собой исчерпывающее введение в очень обширную в настоящее время теорию систем баз данных. С помощью этой книги читатель сможет приобрести фундаментальные знания в области технологии баз данных (DBMS), а также ознакомиться с направлениями, по которым рассматриваемая сфера деятельности, вероятно, будет развиваться в будущем.
Читать дальше »

Опубликовано 01.03.2009 | Автор сообщения Константин Лисянский | Категории: Администратор БД, Архитектор BI, Архитектор ETL, Для начинающих, Для продвинутых, Для экспертов, Книги, На русском, Разработчик ETL, Разработчик моделей данных, Руководитель подразделения BI/DWH, Специалист по обучению

The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd Edition

Ralph Kimball, Margy Ross

The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd EditionОчень хорошее введение в технологию многомерного моделирования.
Если вы собираетесь заниматься хранилищами данных (DWH), особенно если вы являетесь разработчиком моделей данных (data modeler) или архитектором хранилищ данных (data warehouse architect), эта книга для вас. Автор книги - известный практик в области хранилищ данных, и ему есть о чем рассказать о технолгии построения многомерных моделей (multidimensional model). Однако, имейте в виду, что монета имеет две стороны, и в случае с хранилищем данных это высказывание имеет силу.
Читать дальше »

Опубликовано 27.02.2009 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, DWH, Kimball, Ralph, Ross, Margy, Архитектор BI, Архитектор ETL, Архитектор данных, Для начинающих, Для продвинутых, Для экспертов, Книги, На английском, Проектирование многомерных моделей, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Специалист по обучению

Архитектуры систем поддержки принятия решений

Автор: Константин Лисянский

Эта небольшая статья была написано достаточно давно и предназначается для людей, которые только приступают к изучению предмета хранилищ данных (DWH).

На сегодняшний день (и, видимо, ещё надолго вперёд) можно выделить четыре наиболее популярных типа архитектур систем поддержки принятия решений (DSS):

  1. Функциональная СППР.
  2. Независимые витрины данных (independent DM).
  3. Двухуровневое хранилище данных (EDW - корпоративное хранилище данных).
  4. Трёхуровневое хранилище данных (hub-and-spoke architecture).

Читать дальше »

Опубликовано 25.02.2009 | Автор сообщения Константин Лисянский | Категории: DWH, Администратор БД, Аналитик качества данных, Архитектор BI, Архитектор ETL, Архитектор данных, Бизнес-аналитик, Бизнес-спонсор, Ведущий тестировщик, Для начинающих, Лисянский, Константин, Менеджер метаданных, Менеджер по безопасности, На русском, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Специалист data mining, Специалист по обучению, Специалист по технической поддержке, Стюард данных, Технический архитектор

Заметки о форуме Oracle по Business Intelligence

19 февраля в Москве в гостинице “Мариотт Гранд Отель” прошёл форум Oracle по бизнес-аналитике (BI). Я решил осветить основные моменты форума (по крайней мере, в части тех докладов, которые удалось послушать).

Выступления

Нужно заметить, что был я не с самого начала в связи с тем что долго искал место для парковки (просьба к Юрию Михайловичу поскорее решить проблему с парковкой в центре Москвы), поэтому доклад об оптимизации бизнес-процессов от Дженка Кирала я пропустил. Кто был - милости прошу отозваться в комментариях.

Второй доклад “Технологии и продукты Oracle для решения аналитических задач” Ольги Горчинской я тоже пропустил (по той же самой причине - Юрий Михайлович +1).
Читать дальше »

Опубликовано 24.02.2009 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, DWH, ETL, Geospatial, Oracle, Oracle Exadata, Архитектор BI, Архитектор ETL, Для начинающих, Для продвинутых, Для экспертов, Лисянский, Константин, На русском, Разработчик BI-портала, Разработчик ETL, Разработчик приложений BI, Руководитель подразделения BI/DWH

IV Форум «Business Intelligence 2009»

4 марта, Москва, отель «Марриотт Тверская»

IV Форум Business Intelligence, организатором которого уже в четвертый раз выступит компания AHConferences, будет посвящен анализу актуальных тенденций в области Business Intelligence в 2009 году. Форум представит оптимальное соотношение презентаций технологических новинок в области бизнес-аналитики и бизнес-кейсов на тему реального применения BI в различных отраслях экономики. 

Новое в 2009 году: