Question

Как мы получаем твиттер (твиты) в HDFS для автономного анализа. у нас есть требование для анализа твитов.

David Gruzman · Answer 1 · 07 февраля 2012

Я бы искал решение в хорошо развитой области потоковых логов в hadoop, поскольку задача выглядит несколько похожей.
Существуют две существующие системы:
Flume: https://github.com/cloudera/flume/wiki
И
Писец: https://github.com/facebook/scribe

Так что ваша задача будетбыть только для извлечения данных из твиттера, что, как я полагаю, не является частью этого вопроса и кормить одну из этих систем с этими журналами.

Kazuki Ohta · Answer 2 · 17 ноября 2012

Fluentd Сборщик журналов только что выпустил свой плагин WebHDFS, который позволяет пользователям мгновенно передавать данные в HDFS.

enter image description here

Fluentd + Hadoop: мгновенный сбор больших данных

Также с помощью fluent-plugin-twitter вы можете собирать потоки Twitter, вызывая его API.Конечно, вы можете создать свой собственный сборщик, который отправляет потоки на Fluentd.Вот пример Ruby для публикации журналов в Fluentd.

Fluentd: импорт данных из приложений Ruby

Debaditya · Answer 3 · 07 февраля 2012

Это может быть решением вашей проблемы.

Инструменты для захвата твитов Twitter
- Создание PDF, DOC, XML и других документовиз твитов Twitter
- твиты в CSV-файлы
Захватывайте их в любом формате.(CSV, TXT, DOC, PDF ... и т. д.)
Поместите его в HDFS.

Twitter - потоковая передача данных Hadoop

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Twitter - потоковая передача данных Hadoop

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов