Зачем объединять решения?Hadoop обладает рядом замечательных возможностей (см. URL ниже).Эти возможности, тем не менее, не позволяют бизнес-пользователям быстро выполнять аналитику.Запросы, которые занимают от 30 минут до часов в Hadoop, доставляются с помощью Infobright за 10 секунд.
Кстати, ваш первоначальный вопрос не предполагал архитектуру MPP и по уважительной причине.Клиенты Infobright Liverail, AdSafe Media и InMobi, среди прочего, используют IEE вместе с Hadoop.
Если вы зарегистрируетесь в Промышленной белой книге http://support.infobright.com/Support/Resource-Library/Whitepapers/, вы увидите текущее состояние рынка, где выделены четыре предлагаемых варианта использования для Hadoop.Он был создан Уэйном Экерсоном, директором по исследованиям, Business Applications and Architecture Group, TechTarget, в сентябре 2011 года.
1) Создать онлайн-архив .
С Hadoop организациям не нужно удалять или отправлять данные в автономное хранилище;они могут поддерживать его в сети неограниченное время, добавляя обычные серверы для удовлетворения требований к хранению и обработке.Hadoop становится недорогой альтернативой для удовлетворения онлайн-требований к архивированию.
2) Заполните хранилище данных .
Организации также могут использовать Hadoop для анализа, интеграции и агрегирования больших объемов веб-данных или других типов данных, а затем отправлять их в хранилище данных, где как обычные, так и опытные пользователи могут запрашивать и анализировать данные с помощью знакомых инструментов BI.Здесь Hadoop становится инструментом ETL для обработки больших объемов веб-данных, прежде чем они попадают в корпоративное хранилище данных.
3) Поддержка аналитики.
Большой массив данных (т. Е.Интернет-разработчики) рассматривают Hadoop в первую очередь как аналитический движок для выполнения аналитических вычислений на больших объемах данных.Для запроса Hadoop аналитикам в настоящее время необходимо писать программы на Java или других языках и понимать MapReduce, платформу для написания распределенных (или параллельных) приложений.Преимущество здесь в том, что аналитики не ограничиваются SQL при формулировании запросов.SQL не поддерживает многие виды аналитики, особенно те, которые включают вычисления между рядами, которые распространены в анализе веб-трафика.Недостатком является то, что Hadoop ориентирован на пакетную обработку и не способствует итеративным запросам.
4) Запускать отчеты.
Ориентированная на пакет ориентация Hadoop делает его пригодным для выполнения регулярно запланированныхотчеты.Вместо того, чтобы создавать отчеты по сводным данным, организации теперь могут использовать их для необработанных данных, гарантируя наиболее точные результаты.