Чтение Hadoop из стандартного потока ввода - PullRequest
0 голосов
/ 27 июля 2011

Я хочу, чтобы моя программа MapReduce читала из стандартного потока ввода (System.in) Например, в методе run () как сделать так, чтобы моя программа читала из System.in вместо файла, подобного этому ... FileInputFormat.addInputPath (job, new Path ("dummy.txt"));

Также, какой класс я должен установить для job.setInputFormat (...)

Ответы [ 2 ]

2 голосов
/ 03 июля 2012

Используйте Hadoop Streaming для этого:

http://wiki.apache.org/hadoop/HadoopStreaming

Поддерживает стандартный ввод, стандартный вывод

0 голосов
/ 20 апреля 2012

Я не видел такого InputFormat , присутствующего в hadoop.Возможно, вам придется время от времени писать System.in и запускать задание hadoop в течение сохраненного контента каждый раз, когда вы его получаете.

Такая ситуация встречается часто при использовании hadoop для обработки файлов журнала, которые создаются / заполняютсянепрерывно.В таком случае целесообразно получать файлы журнала ежедневно или еженедельно и запускать над ним задание hadoop, как только вы его получите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...