Автор: Bill Inmon
Дата публикации оригинала: 2006-09-21
Источник: сайт B-Eye-Network

Достоверность данных - очень важный фактор в достижении успеха, но она не является автоматической. Как вы ее достигаете?

Существует много аспектов данных, которые важны, но нет ничего более важного, чем достоверность данных. Если данные полностью достоверны, можно предпринимать хорошие, взвешенные решения. При этом фактор догадок минимален, и существует меньше конфликтующих вариантов, основанных на связанных, но несколько отличающихся данных. Вся организация получает возможность концентрироваться и пребывать в гармонии. Без достоверных данных у организации возникают трудности с информированностью и принятием правильных решений.

Одним словом, иметь данные – это хорошо, но если они достоверные – ещё лучше.

Элементы достоверности данных

Итак, каковы же элементы достоверности данных? Данные – это как отшлифованный драгоценный камень. Существует много аспектов данных, и каждый из аспектов является важным фактором при проверке достоверности данных.

Одни из самых важных аспектов для небольших объёмов данных представлены ниже:

  • Безошибочность. Если данные неточные, им нельзя верить.
  • Своевременность. Если данные несвоевременные, им нельзя верить.
  • Доступность. Если данные недоступны, их нельзя использовать, и им тяжело верить.
  • Точность. Для того чтобы данным можно было верить, их точность должна соответствовать точности измеряемой величины.
  • Источник. Во многих случаях важен источник данных (data source). Если источник скрыт или неизвестен, тогда данным можно верить гораздо меньше.
  • Определение данных (data definition). Определение данных важно, так как при их использовании целевая группа знает, что описывается.
  • Скорость доступа. Если данные нельзя получить быстро, они становятся гораздо менее полезными и со временем им можно гораздо меньше верить.
  • Изменчивость во времени. Некоторые данные соответствуют действительности только на определенный момент времени. В этом случае для достоверности данных необходимо предоставление данных на определенный момент времени.
  • Представление. Данные, представленные американской аудитории на китайском или японском языке, не могут быть использованы ею, за исключением тех, кто говорит и читает на китайском или японском языке.
  • Структурирование. Для того чтобы использоваться данные должны иметь определенный уровень структурирования (см. structured data).
  • Безопасность. Некоторые данные необходимо обезопасить. Другие данные должны быть доступны для всех, кто хочет их узнать. Для того чтобы быть достоверными, определенные данные должны быть безопасными.
  • Момент получения данных. Когда впервые были получены данные?

Для обеспечения достоверности данных, которые создаются в результате расчётов, необходимо соответствие другим факторам. Вот некоторые из этих факторов:

  • Расчёты, используемые для получения единицы данных.
  • Дата и время, когда были произведены расчёты.
  • Организация, выполнившая расчёты.
  • Необработанные данные, включенные в расчёты.
  • Необработанные данные, исключенные из расчётов.

Систематическая достоверность данных

Существует совершенно иной ряд факторов, относящихся к достоверности данных. Эти факторы проявляются на системном уровне, а не на уровне отдельных данных. Систематические факторы, относящиеся к достоверности данных, включают в себя:

  • Определение главной системы ввода данных (system of record). Когда определена главная система ввода данных, данные интегрированы. Если главная система ввода данных внедрена правильно, отсутствуют совпадения и избыточность данных (data redundancy) и в любое время отражается источник данных или данные, включенные в расчёты.
  • Интеграция данных (data integration), когда отсутствуют источники поступления неинтегрированных данных. Когда данные источники устранены, есть возможность правильно внедрить главную систему ввода данных. Когда такие источники существуют, в большей или меньшей степени будет происходить наложение (совпадение) данных. А когда происходит совпадение данных, возникает несоответствие значений данных в различных местах.
  • Архитектурный план. Архитектурный план для информационных систем описывает то, где находилась организация и куда она направляется. В архитектурном плане описывается, как новая информация добавляется к существующей информации, определенным образом, который продолжает интеграцию данных.

Достоверность данных очень желательна для организации. Если данные организации достоверны, организация может принимать наиболее своевременные и точные решения – от несложных решений с малыми объёмами данных до важных, стратегических решений с большими объёмами данных.

Достижение достоверности данных

Одно дело описать, что такое достоверность данных, другое дело – добиться достоверности данных. Для достижения достоверности данных организация должна сделать официальное заявление по архитектуре системы, которое определяет всю информационную инфраструктуру. Достоверность данных достигается постепенно. В зависимости от организации, достоверность данных может быть достигнута за короткий или более длинный период времени. В любом случае, достоверность данных достигается со временем, постепенно, шаг за шагом.

Каждому аспекту достоверности данных необходимо уделить внимание, и в некоторых случаях работа над этими аспектами может потребовать значительных усилий. Достоверность данных – это не продукт, который вы идёте покупать в магазин. Наоборот, достоверность данных создается как стена – кирпичик за кирпичиком. В любое время вы можете добавить новый кирпичик, который повышает достоверность данных.

Формирование достоверности данных – это долгосрочный проект. В связи с этим, необходима информационная архитектура. Архитектура позволяет многим людям долгое время работать во взаимодействии друг с другом по общему плану. Без общей архитектуры стены здания будут разными. Одни будут из кирпича, другие – из шлакобетона. Некоторые будут из камня, а некоторые – из дерева. Одна часть стены будет на 90 градусов повернута от других частей стены, находящихся в том же месте, в результате чего стена не будет соединена. Такой неорганизованный подход к построению стены различными людьми в течение долгого периода времени приведет к отсутствию общей схемы – общей архитектуры – с которой необходимо начинать работу.

Ориентируемая на реализацию архитектура

К тому же, архитектура должна быть ориентированной на реализацию. Не хорошо иметь архитектурный план, который не может быть реализован. Тщетна архитектура, которая при планировании и структурировании системы приносит результаты только на бумаге.

Для того чтобы успешно ориентироваться на реализацию, архитектура должна соответствовать следующим требованиям:

  • Возможность управлять большими объёмами данных.
  • Возможность управлять различными видами данных.
  • Возможность управлять большим количеством операций.
  • Возможность управлять различными видами операций.
  • Возможность создавать операции, управлять ими и добиваться интегрированности данных при работе.
  • Признание жизненного цикла данных, так как они поступают в организацию и пребывают в ней некоторое время.
  • Необходимость интегрировать и хранить метаданные как центральную часть окружающей среды.
  • Необходимость хранить данные на начальном уровне, так чтобы данные можно было изменить в зависимости от будущих потребностей.
  • Необходимость интегрировать и хранить метаданные как центральную часть окружающей среды.
  • Необходимость предоставить конечным пользователям возможность менять свой подход к использованию данных.
  • Необходимость наличия различных уровней безопасности в архитектуре и информационной инфраструктуре.
  • Необходимость эволюционного отхода от «вылетающих в трубу» систем.
  • Необходимость рационального разделения данных в организации.
  • Необходимость эволюционной реализации.
  • Осведомленность о расходах на поддержку инфраструктуры.
  • Возможность выбора необходимых технологий реализации из широкого списка поставщиков, и так далее.

Достоверность данных достигается шаг за шагом. Ориентируемая на реализацию архитектура необходима для достижения достоверности данных. Архитектура необходима, потому что достоверность данных достигается на инфраструктурном уровне.


Для удобства отслеживания новых публикаций рекомендуем подписаться на рассылку или на канал RSS.

Читайте также: