Специальные отчеты Hadoop - PullRequest
       12

Специальные отчеты Hadoop

0 голосов
/ 21 октября 2010

Я хочу позволить людям вставлять простые текстовые условия поиска, запускать задание на свиноводство (если это лучше? Это то, что я знаю лучше всего) и выводить результаты (результаты файла tsv?), Чтобы я мог показывать их в сетиинтерфейс.

Есть ли что-нибудь, что подходит к этой проблеме?
Что-нибудь известно, чтобы связать несколько разрозненных частей потока, который я собираюсь, вместе?

Спасибо

Ответы [ 2 ]

3 голосов
/ 21 октября 2010

Почему бы вам не проиндексировать документы в Lucene или Solr?Тогда вы можете сделать поиск текста в режиме реального времени.Hadoop разработан для пакетно-ориентированных процессов, что не похоже на то, что вам нужно в этом случае.

1 голос
/ 23 октября 2010

Ну, это зависит от требований вашего проекта.Нужно ли это с малой задержкой, и насколько сложен поиск по запросу.Ну, я думаю, что hbase + pig может быть составным решением.hbase может использоваться для поиска в режиме реального времени (хотя его функция поиска не так мощна, как в СУБД) и pig для обработки большого количества данных в пакетном режиме.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...