Добавление / просмотр / удаление данных из HBase с использованием PHP и Mapreduce в Java? - PullRequest
1 голос
/ 14 ноября 2010

Привет, друзья
Я создаю веб-сканер, мне нравится знать кое-что об этом,
1) Могу ли я использовать Map Reduce для извлечения данных из NET
2) Могу ли я сохранить сохраненные данные в HBase?
3) Могу ли я написать приложение на PHP для получения данных из HBase? Если да, можете ли вы дать мне фрагмент кода? Как я могу добавить / просмотреть / удалить данные из HBase с помощью PHP

Ответы [ 3 ]

1 голос
/ 18 ноября 2010

По вашим вопросам, да, все это можно сделать. Как вы к этому подходите, зависит от того, чего именно вы хотите достичь.

1) Ваш основной элемент управления должен был бы разделить задачу. Скорее всего, вы бы поддерживали какой-то список адресов для сканирования, возможно, запускали бы последовательные задачи mapreduce, которые каждый раз читали бы список, разбивали список между мапперами, которые могли бы выполнять сканирование, и писали напрямую в hbase или другого посредника. Они также, вероятно, будут выводить сгенерированные URL для сканирования после следующего, который, в свою очередь, будет отфильтрован до уникальных в фазе сокращения, при этом редуктор выведет список вещей для сканирования следующим. Вам нужно будет вести список недавно просканированных вещей и отфильтровывать их, но это не относится к MR / Hbase.

2) Вы можете использовать формат вывода таблицы для отправки результатов в hbase. Вы также можете просто устанавливать соединения HBase с HTable и писать прямо в свой маппер.

3) Как сказал TheDeveloper, да, с экономией. Его ссылка хорошая.

1 голос
/ 12 апреля 2011

Можно легко сделать через REST, используя Stargate.

1 голос
/ 16 ноября 2010

Для вопросов № 3 вы можете взаимодействовать с Hbase из PHP, но вам нужно сделать это через интерфейс Thrift.См. этот блог для получения дополнительной информации.Надеюсь, это поможет

...