Exadata: Oracle наконец отвечает бросившим вызов в области хранилищ данных
Автор: Curt Monash
Дата публикации оригинала - 2008-09-24
Перевод: Константин Лисянский
Источник: Блог Курта Монаша
Oracle в партнёрстве с HP объявили, новую линейку продуктов класса комплексов для хранилищ данных (DWH), умно названную “Exadata.” Основная идея, похоже, заключается в том, что обработка базы данных разбивается между двумя наборами серверов:
- (Новая вещь) Набор серверов back-end — Oracle Exadata Storage Server — который забирает данные с дисков и выполняет некоторую подготовительную обработку запросов.
- (Старая вещь) Обычный кластер Oracle RAC в качестве front-end.
Были озвучены цифры, предполагающие, что в противоположность предыдущим предложениям от компании Oracle, комплекс на основе Exadata по крайней мере обладает масштабируемостью (scalability) и соотношением цена/производительность, которые стоит сравнивать с Teradata — эй, Exa больше, чем Tera! — Netezza, и остальных.
Кевин Клоссон (Kevin Closson), котрый, очевидно работал над проектом, предлагает наиболее полезное и детальное описание Exadata из всех, что я до сих пор видел. В частности, он и Oracle, похоже, утверждают:
- Вввод/вывод больше не будет являться узким местом, благодаря direct-attached storage (DAS), коммутатору Infiniband, и так далее. (Это звучит приятно.)
- Файлы будут оптимизированы одновременно для последовательного сканирования таблиц (full table scan) и обычного чтения блоками в случайном порядке. (Да, ну?)
Если в целях дискуссии мы примем эти утверждения, мне, всё равно, не ясно является ли подход Oracle полностью конкурирующим с подходом Teradata, Netezza и остальными. Какая же обработка запросов не выполянется пока на Exadata Storage и должна выполняться на Oracle RAC. Но, что в точности RAC привносит в распараллеливание? Хорошо, он должен помочь с одновременно работающими пользователями. Та производительность, которую Oracle может достичь с небольшим количеством пользователей, не должна сильно деградировать по мере роста числа пользователей. Комплекс, основанный на Exadata, возможно, покажет гораздо лучшие возможности по поддержке одновременно работающих пользователей, чем обычно демонстрируют первые релизы решений-стартапов.
Это хорошие новости в моём предположении. Ещё одним традиционным узким местом первого релиза является то, что слишком много данных передаётся на «толстую голову», и распараллеливание обработки запросов в действительности выполняется достаточно простым способом. До сих пор я не заметил ничего, что позволило бы предположить, что Oracle не имеет тех же проблем, что и другие поставщики.
Что же касается продвинутых средств Oracle для ускорения запросов, таких как продвинутые материализованные представления (materialized view) и так далее – я думаю, пользователи имеют всё возрастающее желание, чтобы все запросы выполнялись быстро, а не только те, которые планировались с этой целью. Так что, я не уверен в том, насколько эти средства принесут преимущество.
И, конечно же, инструменты управления Oracle сильны, и цены на них высоки. Это две данности.
Ссылки по теме:
- Dividing the data warehousing work among MPP nodes
- SANs vs. DAS in MPP data warehousing
- Three ways Oracle or Microsoft could go MPP
- The actual press release
Ссылки на статьи Курта по следующим категориям (на английском языке):
Data warehousing, Oracle, Parallelization
Для удобства отслеживания новых публикаций рекомендуем подписаться на рассылку или на канал RSS.
September 27th, 2008 at 12:40 pm
[…] к моим мыслям, опубликованным ранее, на предмет объявления о комплексе для хранилищ данных Oracle Exadata, разрешите предложить несколько кратких […]