У меня есть 2 вопроса:
У меня большой архив записей, несколько миллионов.Мне нужно перенести этот файл с одного компьютера на компьютер кластера hadoop.Я думаю, что нет команды scp в hadoop (или есть?) Как передать файлы на машину hadoop?
Кроме того, как только файл находится в моем кластере hadoop, я хочу искать записи, которые содержатконкретная строка, скажем «XYZTechnologies».Как это сделать свинья?Некоторый пример кода был бы хорош, чтобы дать мне преимущество.
Это первый раз, когда я работаю над Hadoop / Pig.Прошу прощения, если это «слишком простой» вопрос.
РЕДАКТИРОВАТЬ 1
Я попробовал то, что предложил Jagaran, и получил следующую ошибку:
2012-03-18 04:12:55,655 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1000: Error during parsing. Encountered " "(" "( "" at line 3, column 26.
Was expecting:
<QUOTEDSTRING> ...
Также обратите внимание, что я хочу найти строку в любом месте записи, поэтому я читаю разделенную табуляцией запись как один столбец:
A = load '/ user / abc/ part-00000 'с использованием PigStorage (' \ n ') AS (Y: chararray);