Позиционирование комплексов для хранилищ данных и специализированных СУБД
Автор: Curt Monash
Дата публикации оригинала: 2008-04-05
Перевод: Константин Лисянский
Источник: Блог Курта Монаша
Сегодня существуют четыре производителя аппаратного обеспечения, каждый из которых либо предлагает, либо готов предложить два различных уровня комплексов для хранилищ данных: Sun, HP, EMC и Teradata. А именно:
- Sun имеет партнёрство с Greenplum и ParAccel.
- HP продаёт Neoview, и помимо этого имеет партнёрство с Vertica.
- EMC (вместе с Dell в Северной Америке и с Bull в Европе) продаёт DATAllegro. Сейчас EMC также начинает партнёрство с ParAccel.
- Teradata уже достаточно близка к выпуску продукта начального уровня.
В добавление к этому, несколько производителей аппаратного обеспечения имеют технические договорённости с Oracle относительно “ссылочной архитектуры” в попытке получить некоторые из преимуществ комплексов. А IBM постоянно находится в состоянии переговоров с поставщиками специализированных систем в области хранилищ данных, несмотря на то, что у них у самих есть несколько предложения в области систем для хранилищ данных.
Позиционирование этих различных предложений запутанно. Частично причина заключается в позах больших поставщиков вроде “Мы большие и надёжные, а эти маленькие начинающие компании – нет до того момента, пока мы не объявим партнёрство с одной из них”. Частично – из-за стансов маленьких компаний в духе “Мы можем делать всё и для всех – и, между прочим, 9 из наших 14 клиентов, которых мы когда-либо имели, делают примерно одно и то же”. Частью причины также является склонность отрасли к секретности.
В первом приближении, я думаю, что существует два осмысленных способа определения уровней. В каждом случае мы говорим о том, для каких типов баз данных каждый из продуктов пригоден.
- Критерий S (“Size” - размер). “Больше того с чем может справиться Oracle” против “Достаточно маленький, чтобы Oracle смог с ним справиться ” (но это зависит от определения слова «справиться»).
- Критерий U (“Usage” - использование). “Полноценное корпоративное хранилище данных ” против “большая гудящая витрина данных”.
Но, это очень разные правила классификации – многие продукты, которые могут быть высокоуровневыми по критерию S, но низкоуровневыми по критерию U, и наоборот. Например:
- Текущие продукты Teradata находятся на верхнем уровне по обоим критериям. Несмотря на это, значительная доля старых инсталляций Teradata имеют размер менее 5 терабайт, или даже 1 терабайт.
- Если обобщить, то Teradata делает упор на критерий U. Следовательно, любой будущий продукт низкого уровня будет, несомненно, позиционироваться как низкоуровневый по этому критерию. Помимо этого, я не удивлюсь, если релиз задержится, и при этом финальная версия этих продуктов будет другой, чем по информации, которая была доступна до этого. Например, они могут быть спроектированы с тем, чтобы конкурировать с более новыми поставщиками, находящихся на высоком уровне по критерию S.
- Netezza явным образом достигла верхнего уровня по критерию размера. Большинство их инсталляций находятся на нижнем уровне по критерию U, но они трубят о нескольких исключениях, о которых они в историях успеха говорят как о «корпоративных хранилищах данных».
- DATAllegro находится на верхнем уровне по критерию S — более остальных поставщиков за исключением Teradata, в том смысле, что существует по крайней мере две истории, которым можно доверять, о хранилищах данных на DATAllegro размером в четверть петабайта или выше. Несмотря на это, DATAllegro по-прежнему находится в основном на низком уровне по критерию U. То есть, наиболее естественный способ использования технологии DATAllegro – это построение Очень Больших витрин данных.
- Vertica – это чисто низкоуровневый игрок по критерию U, если взять в расчёт их фокус на схемах с одной таблицей фактов. Но они уже на пути к высокому уровню по критерию S.
- Dataupia находится на границе уровней по критерию S. То есть, они предназначена для разгрузки существующих баз данных на Oracle, SQL Server или DB2, или в некоторых случаях OEM – для того, чтобы быть более дешёвой альтернативой. Это звучит как нижний уровень. С другой стороны, у них есть одна инсталляция на 120 терабайт, которая помещает их в двойной степени на высокий уровень. По критерию U они на достаточно низком уровне.
- ParAccel, похоже, находится на низком уровне по двум критериям. И я тоже на фоне их секретности сгораю от желания найти исключения.
- Oracle, MS SQL Server, и другие находятся, практически по определению, на низком уровне по критерию S, но на верхнем уровне по критерию U.
- HP Neoview, очевидно, нацелен на то, чтобы быть на высоком уровне по обоим критериям. Но, как большинство специализированных продуктов, они зашли намного дальше по критерию размера, нежели по критерию использования. Несмотря на это, похоже, что по критерию S они не зашли дальше своего партнёра – компании Vertica.
- Greenplum, очевидно, достигли высокого уровня по критерию размера. Но, как и большинство конкурентов, они, похоже, находятся на низком уровне по критерию использования.
- Infobright находится на низком уровне по обоим критериям. (Они пока даже не предлагают MPP).
- Kognitio KX2 - на низком уровне по обоим критериям. Однако Kognitio стремится подняться вверх по критерию использования.
- В последний раз, когда я смотрел на Sybase IQ, он был на низком уровне по обоим критериям.
Ссылки по теме:
Ссылки на статьи Курта по следующим категориям (на английском языке):
Analytic technologies, DATAllegro, Data warehouse appliances, Data warehousing, Dataupia, EMC, Greenplum, HP and Neoview, IBM and DB2, Infobright, Kognitio, Microsoft and SQL*Server, Netezza, Oracle, ParAccel, Sybase, Teradata
Для удобства отслеживания новых публикаций рекомендуем подписаться на рассылку или на канал RSS.