Автор: Richard Skriletz
Дата публикации оригинала: 2007-04-17
Перевод: Олег Кузьменко
Источник: Сайт BeyeNETWORK

После того, как моя последняя статья была опубликована, мне написал специалист по управлению данными, работающий в большой компании финансового сектора. Эта компания «разбирается» с основными данными при помощи решения технического характера, которое ей влетит в копеечку. Тем не менее, они никак не могут докопаться до сути проблем с данными, например, они не знают, кто же является клиентом компании. Этот человек разочарован тем, что в который раз инициатива подразделения ИТ, сфокусированная именно на технологической платформе, рассматривается как решение проблемы. Я дорожу тем, что читатели рассказывают мне о вопросах, вызывающих их озабоченность, поэтому в этой первой статье об основных данных (master data) дается определение тому, что же это такое, и почему это является задачей, которую в первую очередь должен решать бизнес.

Основные данные становятся одним из основных средств в арсенале бизнеса. Они могут обеспечить точность представления важнейшей информации и объектов бизнеса, а также предоставить контроль над ними. Однако успех с основными данными не достигается потому, что тема основных данных плохо понимается бизнес-сообществом. Главная причина этой ситуации заключается в том, что основные данные считаются проблемой самих данных, но не бизнеса.

Что такое основные данные? К сожалению, на это простой вопрос нет простого ответа, потому что основные данные постоянно рассматривались как техническая проблема, вызываемая наличием дублированных данных (redundant data), которые бизнес-подразделения и прикладные системы используют несогласованным образом. Посмотрите на это определение, данное в Википедии: «Управление основными данными, также известное как управление справочными данными (reference data) (NB: дальше в этой статье я объясню разницу между основными и справочными данными), является дисциплиной информационных технологий, которая нацелена на управление основными и справочными данными, разделяемыми несколькими различными ИТ-системами и группами. Управление основными данными необходимо для обеспечения непротиворечивой, согласованной обработки данных между разнообразными системными архитектурами и бизнес-функциями».

Или рассмотрите эту точку зрения на основные данные, выражаемую С. Дже Янгом (S. Jae Yang): «Новый способ исправить старую проблему компаний, а именно: левая рука не знает то, что делает правая. Цель: соберите воедино все разрозненные, часто противоречивые записи, которые есть у вас по клиентам и транзакциям, в один выверенный мастер-файл.»

И, наконец, еще одно определение от Дэвида Лошина (David Loshin), уважаемого специалиста по данным и качеству данных (data quality): «Наборы основных данных – это синхронизированные копии основных сущностей (entity) бизнеса, используемых в традиционных или аналитических приложениях (analytical application) по всему предприятию, которые управляются согласно установленному на предприятии порядку вместе со связанными с ними метаданными, атрибутами, определениями, связями и таксономиям.»

Бытует мнение, что основные данные – это технический вопрос, поэтому неудивительно, что люди бизнеса слабо понимают тематику основных данных. Основные данные, прежде всего, должны заботить бизнес, и решение проблем, связанных с их техническими аспектами - это лечение симптомов, но не самой болезни. Пока этот существенный факт не будет осознан и использован в качестве основы для дальнейших действий, любой почин, связанный с основными данными, будет обречен на провал, потому что он будет направлен на среду ИТ предприятия, а не на бизнес и его функционирование.

Почему основные данные должны являться предметом заботы бизнеса
Куда представитель бизнес-подразделения обратится за точным списком всех клиентов, продуктов, поставщиков, или контрактов? Бизнесу нужен доступ к данным по этим сущностям, например, для проверки клиентов, поставщиков, заказов, выставленных счетов, счетов к получению и оплате. В каждой организации эта важная информация разбросана между несколькими системами бэк-офиса и обработки транзакций. Ели бы эти данные лежали в одном месте, то это позволило бы предприятию легко и эффективно справляться с подобными проблемами. Если такого места нет, то не существует действенного способа управлять и контролировать эти сущности. Создание такого места, в котором хранится информация по важнейшим объектам бизнеса, является целью управления основными данными.

Мое определение основных данных таково: «Основные данные – это официальное представление в виде данных реальных объектов, которые являются частью бизнеса, причем «реальными» называются те объекты, которые физически существуют в мире.» Давайте разберем на это определение по частям:

  • Официальное означает, что основные данные всегда, всегда правильны, точны, полны и для любой цели являются официальной информацией о физическом объекте бизнеса. В качестве таковых, основные данные являются важнейшим элементом для целей аудита и выполнения требований регуляторов.

  • Представление в виде данных означает, что основные данные – это данные, а не сама вещь. Однако, изображения продуктов, офисов, сотрудников, контрактов и т.д. также могут быть элементом основных данных.

  • Реальные объекты - это те, которые физически существуют в мире, включая клиентов, поставщиков, продукты, контракты, офисы, сотрудников, а также и другие объекты, которые существуют в мире и которые компания создает или использует при ведении бизнеса.

  • Которые являются частью бизнеса означает, что только объекты и факты, имеющие отношение к бизнесу, включаются в основные данные.

В таком ракурсе, основные данные – это точная регистрация атрибутов важнейших сущностей бизнеса, которые могут быть соотнесены с «реальным миром». Основные данные – это представление всего того, что реально существует для бизнеса.

Будучи важным элементом бизнеса, основные данные оказывают явное воздействие на бизнес. Например, если вы продаете какой-то продукт клиенту, то становится все более необходимым знать, какие другие продукты этот клиент купил у вас. Если вы – компания, работающая в финансовом секторе, то закон The Patriot Act (американский закон о противодействии террористической деятельности – прим. переводчика) требует этого, также как и закон HIPAA (Health Insurance Portability and Accountability Act, американский закон о медицинском страховании – прим. переводчика) требует этого от больниц и госпиталей, и так далее. Если вы продаете продукты, имеющие гарантию, например, автозапчасти, может понадобиться знание того, какие другие запчасти, необходимые для соблюдения гарантийных условий, были приобретены. Клиенты, продукты, офисы, контракты, продажи, и все другие элементы основных данных играют центральную роль в ведении бизнеса в современном мире.

Некоторые важные элементы не включены в это определение, например, организация (используется для организации информации, отчетов, показателей, и т.д.), различные способы категоризации (такие, как иерархия продуктов, классификация офисов или других точек ведения бизнеса компании и т.д.), а также другие элементы, используемые для понимания бизнеса. Эти элементы используются повсюду на предприятии, но они имеют абстрактную природу, т.е. они не существуют физически в реальном мире.

Это – примеры справочных данных, вот мое определение для них: «Справочные данные - это официальное представление в виде данных абстрактных структур, используемых на предприятии для понимания организации, классификации или других способов рассмотрения реальных сущностей бизнеса». Профессионалы business intelligence (BI) определят принадлежность справочных данных как измерений в многомерных моделях (multidimensional model).

Основные и справочные данные описывают реальные (компании, продукты, офисы, производители и т.д.) и абстрактные (организационная структура, иерархии, классификация продуктов, клиентов, поставщиков и т.д.) элементы бизнеса. Основные и справочные данные являются аспектом ведения бизнеса, а не проблемой самих данных, потому что бизнес-подразделения, а не подразделение ИТ, отвечают за управление и поддержание этих элементов бизнеса согласованными, непротиворечивыми и соответствующим фактам. Элементы бизнеса и связанные с ними основные данные подлежат аудиту и проверке на соответствие требованиям регуляторов; со справочными данными, хотя и не до такой степени, надо обращаться также строго, как и с основными данными во всех других отношениях. Поэтому в остальных статьях этой серии мы будем использовать термин «основные данные» для обозначения как основных, так и справочных данных.

В моей следующей статье я объясню, как ИТ и управление данными вносят свой вклад в появление проблемы с основными данными.


Для удобства отслеживания новых публикаций рекомендуем подписаться на рассылку или на канал RSS.

Читайте также: