Архитектуры систем поддержки принятия решений

Автор: Константин Лисянский

Эта небольшая статья была написано достаточно давно и предназначается для людей, которые только приступают к изучению предмета хранилищ данных (DWH).

На сегодняшний день (и, видимо, ещё надолго вперёд) можно выделить четыре наиболее популярных типа архитектур систем поддержки принятия решений (DSS):

  1. Функциональная СППР.
  2. Независимые витрины данных (independent DM).
  3. Двухуровневое хранилище данных (EDW - корпоративное хранилище данных).
  4. Трёхуровневое хранилище данных (hub-and-spoke architecture).

Читать дальше »

Опубликовано 25.02.2009 | Автор сообщения Константин Лисянский | Категории: DWH, Администратор БД, Аналитик качества данных, Архитектор BI, Архитектор ETL, Архитектор данных, Бизнес-аналитик, Бизнес-спонсор, Ведущий тестировщик, Для начинающих, Лисянский, Константин, Менеджер метаданных, Менеджер по безопасности, На русском, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Специалист data mining, Специалист по обучению, Специалист по технической поддержке, Стюард данных, Технический архитектор

Dynamic Warehousing: Data Mining Made Easy

В этой публикации обсуждается методология и некоторые методы data mining. Показывается как эти методы можно применять. Книга ориентирована на использование инструментов IBM.

Читать…

Опубликовано 12.02.2009 | Автор сообщения Константин Лисянский | Категории: Data Mining, IBM, Для начинающих, Для продвинутых, На английском, Специалист data mining

IV Форум «Business Intelligence 2009»

4 марта, Москва, отель «Марриотт Тверская»

IV Форум Business Intelligence, организатором которого уже в четвертый раз выступит компания AHConferences, будет посвящен анализу актуальных тенденций в области Business Intelligence в 2009 году. Форум представит оптимальное соотношение презентаций технологических новинок в области бизнес-аналитики и бизнес-кейсов на тему реального применения BI в различных отраслях экономики. 

Новое в 2009 году:

Business Intelligence Certification Guide

Учебник для подготовки к сдаче экзамена по теме Business Intelligence от компании IBM. Описывает основные концепции хранилищ данных и приложений на их основе. Рассматриваются различные варианты архитектуры хранилищ данных. Описываются основные компоненты хранилища данны, а также этапы проекта по построению хранилища данных. Рекомендуется начинающим строителям хранилищ данных.

Читать…

Опубликовано 05.02.2009 | Автор сообщения Константин Лисянский | Категории: Business Intelligence, DWH, ETL, IBM, ODS, OLAP, Администратор БД, Аналитик качества данных, Архитектор BI, Архитектор ETL, Архитектор данных, Бизнес-аналитик, Бизнес-спонсор, Ведущий тестировщик, Для начинающих, Менеджер метаданных, Менеджер по безопасности, На английском, Проектирование многомерных моделей, Разработчик BI-портала, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Руководитель проекта от бизнеса, Специалист data mining, Специалист по обучению, Специалист по технической поддержке, Стюард данных, Технический архитектор, Управление метаданными

Методология CRISP-DM

Стандартная независимая от продуктов методология проведения проектов в области data mining. Документ описывает жизненный цикл проекта data mining. Описываются все фазы проекта, даётся пошаговое описание задач внутри каждой фазы и связь между ними. Документ можно бесплатно скачать.

Читать документ…

Опубликовано 22.01.2009 | Автор сообщения Константин Лисянский | Категории: Data Mining, На английском, Специалист data mining

Neural Networks versus CHAID

Статья посвящена анализу двух алгоритмов, использующихся в приложениях класса data mining - CHAID (деревья решений) и нейронных сетей. Описываются основные принципы данных алгоритмов, процесс построения моделей с их помощью, достоинства и недостатки, а также сферы применения каждого из них. Статья снабжена небольшим глоссарием.

Читать статью…

Опубликовано 18.01.2009 | Автор сообщения Константин Лисянский | Категории: Data Mining, Для начинающих, Для продвинутых, На английском, Специалист data mining

Data Mining Strategies

В начале статьи описываются причины, по которым компании делают ставку на технологию data mining. Далее автор дает множество практических рекомендаций по поводу того, как приступить к процессу, на чем концентрировать свое внимание при проведении проектов, какие данные лучше использовать для анализа, к чему стоит приготовиться и чего стоит избегать.

Читать статью…

Опубликовано 15.01.2009 | Автор сообщения Константин Лисянский | Категории: Data Mining, Для начинающих, На английском, Руководитель подразделения BI/DWH, Специалист data mining

Introduction to Data Mining and Knowledge Discovery, Third Edition

36-страничный буклет, нацеленный на бизнес-пользователей, которым необходим ясный нетехнический обзор методов и возможностей data mining.

Читать статью (в формате PDF)…

Опубликовано 14.01.2009 | Автор сообщения Константин Лисянский | Категории: Data Mining, Для начинающих, На английском, Руководитель подразделения BI/DWH, Специалист data mining

An Overview of Data Mining Techniques

В этом фрагменте из книги Building Data Mining Applications for CRM описаны некоторые из наиболее распространённых на сегодняшний день алгоритмов data mining.

Читать…

Опубликовано 14.01.2009 | Автор сообщения Константин Лисянский | Категории: Data Mining, Для начинающих, На английском, Руководитель подразделения BI/DWH, Руководитель проекта, Специалист data mining

Известные области применения MapReduce

Автор: Curt Monash
Дата публикации оригинала: 2008-08-26
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Большинство существующих сфер использования MapReduce, о которых я слышал, попадают в одну из следующих категорий:

  • Выделение токенов из текста, индексирование и поиск по тексту
  • Создание других структур данных (например, графов)
  • Data mining и обучение машин

Этот список покрывает все области применения MapReduce, о которых, помнится, я слышал от компаний и пользователей, и он также содержит большинство тех приложений, которые я нашел в двух больших источниках в Интернете, а именно:

1. В своей презентации Google рассказывает о следующих задачах, для которых может быть применен MapReduce:

Читать дальше »

Опубликовано 07.11.2008 | Автор сообщения Олег Кузьменко | Категории: MapReduce, Monash, Curt, itblogs, Для продвинутых, Для экспертов, На русском, Разработчик приложений BI, Руководитель подразделения BI/DWH, Специалист data mining, Технический архитектор