Даешь свободу выбора СУБД!

Автор: Curt Monash
Дата публикации оригинала: 2008-08-20
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Если и есть одна центральная тема, которой придерживается блог DBMS2, так это то, что во многих случаях вместо традиционных СУБД-лидеров можно использовать современные «альтернативные» СУБД. Так что это было лишь вопросом времени, пока кто-то не спонсировал доклад-исследование на эту тему. Доклад, спонсированный компанией EnterpriseDB, размещен вместе с моими другими недавними докладами. Его заключительная часть, резюмирующая то, какой тип СУБД вам следует использовать при каких обстоятельствах, воспроизведена ниже.

Читать дальше »

Опубликовано 11.11.2008 | Автор сообщения Олег Кузьменко | Категории: Business Intelligence, DWH, EnterpriseDB, Monash, Curt, Oracle, itblogs, Администратор БД, Архитектор BI, Для начинающих, Для продвинутых, На русском, Руководитель подразделения BI/DWH, Технический архитектор

Сжатие данных в СУБД выходит на первый план

Автор: Curt Monash
Дата публикации оригинала: 2008-08-08
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Я уже много писал о сжатии данных в СУБД, ориентированных на хранилища данных; поставщики предподносят компрессию как одно из основных достоинств их продуктов, которое приносит непосредственную выгоду клиентам. Наиболее примечательной, вероятно, является короткая статья, которую Майк Стоунбрейкер (Mike Stonebraker) написал для этого блога, о тех преимуществах в области компрессии, которыми обладают СУБД с хранением данных по столбцам перед теми, в которых данные хранятся построчно, еще до того, как он и его коллеги открыли свой блог. Компрессия уже давно играет одну из главных ролей в истории DATAllegro, в то время, как Netezza занялась этим вопросом совсем недавно. Одной из причин, почему Teradata поставлена в невыгодное положение в плане ценовой политики, может служить как раз слабая компрессия. И так далее.

Читать дальше »

Опубликовано 06.10.2008 | Автор сообщения Олег Кузьменко | Категории: DATAllegro, DWH, Microsoft, Monash, Curt, Oracle, Teradata, Vertica, itblogs, Администратор БД, Для начинающих, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH, Технический архитектор 1 комментарий

Oracle Optimized Warehouse Initiative

Автор: Curt Monash
Дата публикации оригинала – 2008-06-28
Перевод: Константин Лисянский
Источник: Блог Курта Монаша

Ответом компании Oracle производителям решений класса data warehouse appliance, а также решению BCU (Balanced Configuration Units) от компании IBM по-прежнему является инициатива Oracle Optimized Warehouse Initiative (OOW, не путать с Oracle Open World). Небольшое количество информации об Oracle Optimized Warehouse можно найти на сайте Oracle. Ещё немного можно найти в этой недавно опубликованной длинной и бездыханной статье от TDWI (The Data Warehouse Institute – прим. перев.), полной таких перлов, как приписывание производителям решений data warehouse appliance «утверждений о том, что реляционные СУБД просто не предназначены для аналитической нагрузки». (Ух, интересно, на чём же по их мнению они работают — на СУБД с моделью CODASYL?)
Читать дальше »

Опубликовано 13.08.2008 | Автор сообщения Константин Лисянский | Категории: IBM, Monash, Curt, Oracle, itblogs, Администратор БД, Архитектор BI, Для продвинутых, Для экспертов, На русском, Руководитель подразделения BI/DWH 1 комментарий

Mastering Data Warehouse Aggregates

Mastering Data Warehouse Aggregates

Первая книга, освещающая в деталях вопросы агрегатных таблиц в схеме звезда.

От издательства:

Эксперт по хранилищам данных Chris Adamson показывает как хорошо спланированный набор агрегатов может кардинально повлиять на общую пропускную способность вашего хранилища данных. Независимо от вашей текущей роли или опыта разработки схем звезда, лучшие практики, описанные в этой книге, помогут вам достичь потрясающего роста производительности, избежав при этом распространённых ошибок.

Начиная от основ схемы звезда до продвинутых методов агрегирования, эта книга освещает вопрос влияния агрегированных таблиц на весь жизненный цикл хранилища данных. После небольшого введения в основы, включая подход к проектированию хранилищ данных на основе схемы звезда, главы книги посвящены главным фазам жизненного цикла хранилища данных. Обсуждаемые темы включают:
Читать дальше »

Опубликовано 15.05.2008 | Автор сообщения Константин Лисянский | Категории: Adamson, Christopher, IBM, Oracle, Администратор БД, Архитектор BI, Архитектор ETL, Ведущий тестировщик, Для продвинутых, Книги, Менеджер метаданных, Менеджер по безопасности, Проектирование многомерных моделей, Работа с агрегатами, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Руководитель подразделения BI/DWH, Руководитель проекта, Специалист по технической поддержке Комментариев 9

Совет №31. Проектируем партицию реального времени

(выдержка из статьи, которая должна была появиться в журнале Intelligent Enterprise)


Несмотря на то, что временной разрыв между промышленными транзакционными системами и хранилищами данных сократился в большинстве случаев до 24 часов, ненасытные маркетинговые пользователи требуют, чтобы хранилище данных наполнялось данными в режиме реального времени.
Большинство разработчиков хранилищ данных скептически относятся к возможностям ускорения существующих ETL-процессов (extract transform load) с 24-часового цикла до цикла в 15 минут. Разработчики хранилищ данных отвечают на это требование созданием партиции реального времени рядом с обычным статическим хранилищем данных.
Читать дальше »

Опубликовано 15.04.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Администратор БД, Архитектор ETL, Для экспертов, На русском, Разработчик ETL, Разработчик моделей данных, Разработчик приложений BI, Советы разработчику ХД

Совет №28. Предотвращение катастрофических сбоев в хранилищах данных

Трагические события 11 сентября заставили нас всех пересмотреть наши возможности и приоритеты. Мы стали решать вопросы нашей сохранности и безопасности способами, казавшимися невероятными всего неделю назад. Мы считали, что наши большие, важные здания и компьютеры, действительно, защищены просто потому, что они настолько большие и важные. Этот миф был развеян. Если что и является наиболее уязвимым, то это – эти типы зданий и компьютеров.
Опустошительное нападение на нашу инфраструктуру также было совершено в то время, когда хранилища данных большинства компаний были переведены в промышленный статус. Хранилища данных на данный момент управляют взаимодействием с клиентами и предоставляют в режиме почти реального времени статус заказов, доставки и платежей, и достаточно часто являются единственным местом сбора информации о прибыльности продуктов или клиентов. Хранилища данных стали обязательной частью многих наших предприятий.
Читать дальше »

Опубликовано 15.04.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Администратор БД, Архитектор BI, Архитектор ETL, Для экспертов, На русском, Руководитель подразделения BI/DWH, Руководитель проекта, Советы разработчику ХД, Технический архитектор

Совет №27. Находимся в режиме off-line как можно меньше

Если вы обновляете ваше хранилище каждый день, у вас имеется характерная свалка, когда вы переводите вчерашние данные в off-line, а сегодняшние - в on-line. Во время этой свалки ваше хранилище данных, возможно, становится недоступным. Если все ваши пользователи находятся в одном часовом поясе, вы можете и не испытывать сильного давления до тех пор пока вы выполняете обновление между тремя и пятью часами утра. Но, что более вероятно, если ваши пользователи разбросаны по стране или по всему миру, вы хотите находиться в режиме off-line как можно меньше, поскольку в вашем случае для хранилища данных солнце никогда не садится. Так как же сократить время простоя до самого минимума?
Читать дальше »

Опубликовано 15.04.2008 | Автор сообщения Константин Лисянский | Категории: Kimball, Ralph, Администратор БД, Архитектор BI, Архитектор ETL, Для экспертов, На русском, Руководитель подразделения BI/DWH, Советы разработчику ХД, Технический архитектор