Где пиво? Где памперсы?

Автор: Bill Inmon
Дата публикации оригинала - 2007-05-24
Источник: сайт B-Eye-Network

Когда комбинации данных обнаружены, аналитики должны определить являются ли корреляции случайными, несистематическими или имеют причинно-следственное взаимоотношение.

Ваша интуиция подсказывает вам, что поиск и обнаружение скрытых комбинаций данных – корреляций – является необходимым. В данных о продажах, обработке претензий, технологических данных и данных по трудовым ресурсам есть комбинации данных, которые повторяются. И при большом количестве цифр, с которыми сталкивается предприятие, данные корреляции данных зачастую скрыты.
Читать дальше »

Опубликовано 17.10.2008 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, Data Mining, Inmon, Bill, Бизнес-аналитик, Для начинающих, Для продвинутых, На русском, Разработчик приложений BI, Розничная торговля, Руководитель подразделения BI/DWH, Специалист data mining

A Universal Data Model For Relationship Development

Автор: Len Silverston
Дата публикации оригинала: 2002-03
Источник: DM Review

Автор статьи предлагает универсальную информационную модель для хранения информации об отношениях между участниками бизнес-процессов.

Речь идёт о предметной области СТОРОНА (PARTY), объясняется назначение сущностей из этой предметной области. Также затрагивается предметная область СОБЫТИЕ (EVENT).

Несмотря на то, что статья написана достаточно давно, она не потеряла своей актуальности.

Читать статью…

Автор сатьи также является автором полезной книги по проектированию моделей данных.

Опубликовано 28.09.2008 | Автор сообщения Константин Лисянский | Категории: Silverston, Len, Архитектор данных, Бизнес-аналитик, Для начинающих, Для продвинутых, Для экспертов, Концептуальное моделирование, На английском, Проектирование нормализованных моделей, Разработчик моделей данных, Стюард данных

Структурированные и неструктурированные данные

Преодоление разрыва

Автор: Билл Инмон
Дата публикации оригинала: 2007-06-21
Источник: сайт B-EyE-Network

Если между двумя мирами структурированных и неструктурированных данных может быть построен мост, то можно будет строить абсолютно новые виды систем.

В большинстве своём информационные системы возникли вокруг структурированных данных и систем. Структурированная среда состоит из данных, у которых есть поля, столбцы, таблицы, строки и индексы. Она сосредотачивается вокруг транзакций, в ней есть отчеты, аудит и определения слов. Со структурированной средой ассоциируется высокий уровень прогнозируемости и порядка.

Неструктурированная среда очень отличается от структурированной. В неструктурированной среде не существует специального порядка. Она состоит из текста, содержащегося в медицинских отчетах, гарантиях, контрактах, электронной почте и электронных таблицах. Для текста не существует правил, управляющих его созданием или использованием. Текст не имеет ключей, индексов, столбцов или атрибутов. Данный текст представлен в свободной форме и является неорганизованным. Тогда как структурированные данные являются организованными.
Читать дальше »

Опубликовано 24.09.2008 | Автор сообщения Константин Лисянский | Категории: Inmon, Bill, Архитектор BI, Бизнес-аналитик, Для начинающих, Для продвинутых, На русском, Разработчик моделей данных, Руководитель подразделения BI/DWH, Руководитель проекта от бизнеса, Специалист data mining, Управление метаданными

Использование инструментов качества данных для определения основных данных

Автор: David Loshin
Дата публикации оригинала: 2006-11-23
Источник: Сайт B-EyE-Network

Эта статья предлагает несколько подходов, которые могут использоваться для сбора информации о потенциальных наборах основных данных предприятия.

Что делает данные «основными данными»? В недавней статье я определил основные данные как «объекты данных, которые являются основными бизнес-объектами, используемыми в организации в различных приложениях, наряду с соответствующими метаданными, атрибутами, определениями, ролями и систематикой». Объекты основных данных – такие «вещи», о которых мы беспокоимся, вещи, которые входят в наши оперативные системы, которые измеряются, о которых сообщается в наших системах отчётности и которые анализируются в наших аналитических системах. Это, например, клиент, поставщик, продукт, политика и так далее.

Так как мы интуитивно понимаем, что объекты основных данных находятся на предприятии, то при рассмотрении возможностей реализации планов управления основными данными существует две тенденции. Одной из них является их обнаружение – какие объекты в наших организациях определяются как основные данные? Второй является оценка – как мы можем отследить и стандартизировать модель и содержимое набора основных данных? Это может казаться относительно лёгкой задачей, но когда каждая сфера деятельности вашей организации имеет свой набор таблиц и приложений, возможность выделить основные данные начинает казаться сложной задачей.
Читать дальше »

Опубликовано 17.09.2008 | Автор сообщения Константин Лисянский | Категории: CDI, Data Quality, Loshin, David, MDM, RDM, Аналитик качества данных, Архитектор BI, Архитектор данных, Бизнес-аналитик, Для начинающих, Для продвинутых, Для экспертов, Менеджер метаданных, На русском, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Управление метаданными

Какой объем исторических данных является достаточным?

Автор публикации Bill Inmon
Дата публикации оригинала 2008-07-10
Перевод: Олег Кузьменко
Материал опубликован на сайте B-Eye Network

Существует много факторов, которые оказывают влияние на объем исторических данных, требуемый предприятию.

Есть старое правило о том, сколько исторических данных нужно конечному пользователю. Конечному пользователю хочется, чтобы у него/нее была «история на два года длиннее, чем есть сейчас. Если у конечных пользователей нет исторических данных, то тогда они хотят данные за последние два года. Если у них есть «история» за три года, то они хотят ее за пять лет, и т.д. Интересно, что это правило не является ни преувеличением, ни приуменьшением. Оно в достаточной степени верно.

Читать дальше »

Опубликовано 18.08.2008 | Автор сообщения Олег Кузьменко | Категории: Inmon, Bill, Архитектор BI, Архитектор данных, Бизнес-аналитик, Для начинающих, Для продвинутых, На русском, Разработчик приложений BI, Стюард данных

Что необходимо учитывать при определении KPI персонала

Дата публикации оригинала - 2007-12-22

Основная проблема определения нефинансовых ключевых показателей эффективности заключается в их субъективности. Например, если определить ключевой показатель эффективности, как среднее время, которое каждый сотрудник команды тратит на выполнение задания или на разрешение проблемы, заявленной клиентом, то он будет зависеть от многих факторов:
Читать дальше »

Опубликовано 29.05.2008 | Автор сообщения Константин Лисянский | Категории: CPM, Аналитик качества данных, Бизнес-аналитик, Для начинающих, Менеджер метаданных, На русском, Разработчик приложений BI, Стюард данных, Усольцев, Олег

Проектирование хранилища данных: анализ данных

Дата публикации оригинала: 2008-05-22
Автор: Олег Усольцев
Материал опубликован в блоге Олега Усольцева

После определения систем-источников данных, которые будут использоваться для заполнения хранилища данных, обязательным является этап анализа данных, который должен основываться на определенных бизнес-требованиях и включает следующие задачи:
Читать дальше »

Опубликовано 27.05.2008 | Автор сообщения Константин Лисянский | Категории: Банки, Бизнес-аналитик, Для начинающих, На русском, Проектирование многомерных моделей, Разработчик моделей данных, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Усольцев, Олег

Иерархия ключевых показателей эффективности

Дата публикации оригинала: 2008-01-13
Автор: Олег Усольцев
Материал опубликован в блоге Олега Усольцева

Одним из подходов к определению ключевых показателей эффективности (КПЭ) на всех уровнях управления, начиная с высших уровней и детализируя их на последующих уровнях, является создание связанного дерева КПЭ. Примером такого дерева является схема расширенного ROI-анализа.
Суть данного подхода заключается в том, что на самом верхнем уровне (стратегический уровень, Level C), определяется несколько ключевых показателей, согласно сформированной стратегии развития компания (стратегическая карта). Соответственно, и цель этих показателей стратегическая – дать высшему руководству представлении о процессе реализации стратегии, в какой точке сейчас мы находимся, насколько отклонились от намеченной стратегии.
Читать дальше »

Опубликовано 21.05.2008 | Автор сообщения Константин Лисянский | Категории: CPM, Бизнес-аналитик, Для начинающих, На русском, Руководитель подразделения BI/DWH, Усольцев, Олег

The Data Warehouse Lifecycle Toolkit

The Data Warehouse Toolkit

Авторы: Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite

Хорошая книга для начала изучения хранилищ данных.
Эта книга даст вам понимание того, что нужно иметь в виду при построении хранилища данных. Она будет полезна как начинающим, так и специалистам, уже занимающимся хранилищами данных. Усилия по сбору информации в одно издание заслуживает уважения. Главы о многомерном моделировании очень хороши (автор является известным популяризатором данного подхода к моделированию). CD-ROM, который продается в комплекте с книгой, содержит много полезной информации, которая поможет вам сэкономить много времени, если ваш проект создается с нуля.
Тем не менее, после того, как вы прочитаете эту книгу, вам придётся поискать специализированные книги, посвященные различным аспектам построения хранилища данных, таким, например, как управление метаданными и управление качеством данных, поскольку они слабо освещены в книге. Я бы дал этой книге пять звездочек, если бы в ней не присутствовала явная агрессивность в отношении моделирования сущность-связь, которое, как я полагаю, имеет свое место в среде хранилищ данных.


Купить книгу на Amazon.com

А, вот это второе издание этой книги, вышедшее в январе 2008 года.

The Data Warehouse Lifecycle Toolkit, 2nd Edition

Авторы: Ralph Kimball, Margy Ross, Warren Thorntwaite, Joy Mundy, Bob Becker

Я пока её не прочитал - заказал, получил и поставил в очередь на чтение. Прочитаю, отпишу. Если кто-то уже прочитал, просьба поделиться своими мыслями.


Купить второе издание на Amazon.com

Опубликовано 20.05.2008 | Автор сообщения Константин Лисянский | Категории: Becker, Bob, Kimball, Ralph, Mundy, Joy, Reevs, Laura, Ross, Margy, Thornthwaite, Warren, Архитектор BI, Архитектор ETL, Архитектор данных, Бизнес-аналитик, Ведущий тестировщик, Для начинающих, Для продвинутых, Для экспертов, Книги, Менеджер метаданных, На английском, Проектирование многомерных моделей, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель проекта, Специалист data mining, Специалист по обучению, Стюард данных

Совет №64. Избегайте изоляции подразделения DW/BI

Дата публикации оригинала: 2005-02-08
Автор оригинала: Margy Ross
Перевод на русский язык: Олег Кузьменко
Оригинальный документ располагается здесь

Наверное, это просто совпадение, но в последнее время несколько человек задали мне схожий вопрос: «Следует ли командам хранилищ данных (DW) или business intelligence (BI) собирать требования от бизнеса?». Честно говоря, у меня волосы встают дыбом от такой постановки вопроса. Я обеспокоена тем фактом, что слишком много организаций чересчур обособили свои подразделения DW/BI.

Конечно, до некоторой степени это разграничение является естественным, особенно когда ресурсы, отведенные на DW/BI, растут по мере расширения инфраструктуры, создавая очевидные проблемы с нормой управляемости (наиболее простое определение этого термина: количество прямых подчинённых у одного менеджера - прим. переводчика). Также разделение труда позволяет специализацию. Если провести аналогию между инфраструктурой DW/BI и рестораном, то можно сказать, что некоторые члены команды чрезвычайно искусны в приготовлении блюд на кухне, в то время как другие очень заботливы и внимательны по отношению к клиентам, обеспечивая тем самым их повторный визит. Существует, насколько можно ожидать, немного официантов, которым вдруг следует облачиться в одеяния шеф-повара, и наоборот.

Читать дальше »

Опубликовано 19.05.2008 | Автор сообщения Олег Кузьменко | Категории: Ross, Margy, Бизнес-аналитик, Для продвинутых, На русском, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Советы разработчику ХД