Автор: Curt Monash
Дата публикации оригинала: 2008-03-14
Перевод: Олег Кузьменко
Источник: Блог Курта Монаша

Одна из интересных частей моего разговора с Джоном О’Брайеном (John O’Brien), техническим директором компании Dataupia, наступила тогда, когда мы заговорили о построении хранилищ данных в общем случае. С одной стороны, он поддержал мнение, что использование Oracle для хранилищ данных размером более 10 терабайт не является хорошей идей, а для SQL Server верхний предел и того ниже. С другой стороны, он сказал, что очень давно он помогал создавать на Oracle хранилища данных размером 50-60 терабайт.

Дело в том, что для построения больших хранилищ данных на Oracle или других традиционных СУБД вам приходится использовать большое количество различных приемов (Джон назвал цифру в 1-2 дюжины), включая схемы, секционирование, специальный SQL, «очень специализированные форматы файлов», и т.д. Подводя итог, Джон сказал, что использование Oracle для хранилищ данных размером более 10 терабайт было очень похоже на работу со структурами баз данных, в которых данные хранятся по столбцам.

Жизнь куда проще в царстве специализации. Купите комплекс для хранилища данных (data warehouse appliance), загрузите его любым мало-мальски разумным способом, и вы, вероятно, добьетесь приличной производительности с самого начала. Конечно, настройка производительности по-прежнему является хорошей идеей. Но ваши усилия будут направлены на то, чтобы система работала лучше, или на то, чтобы исчезли немногие досаждающие проблемы с производительностью. Вам не приходится совершать подвиги лишь для того, чтобы система в принципе заработала.

Ссылки на статьи Курта по следующим категориям (на английском языке):
Analytic technologies, Data warehouse appliances, Data warehousing, Microsoft and SQL*Server, Oracle


Для удобства отслеживания новых публикаций рекомендуем подписаться на рассылку или на канал RSS.

Читайте также: