Hadoop: ошибка в настройке объекта - PullRequest
7 голосов
/ 24 января 2012

Я пытаюсь запустить тесты Terasort и получаю следующее исключение:

java.lang.RuntimeException: Error in configuring object
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)
    at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:117)
    at org.apache.hadoop.mapred.MapTask$OldOutputCollector.<init>(MapTask.java:573)
    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:435)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:371)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:259)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
    at org.apache.hadoop.mapred.Child.main(Child.java:253)
Caused by: java.lang.reflect.InvocationTargetException
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:88)
    ... 10 more
Caused by: java.lang.IllegalArgumentException: can't read paritions file
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:213)
    ... 15 more
Caused by: java.io.FileNotFoundException: File _partition.lst does not exist.
    at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:371)
    at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:245)
    at org.apache.hadoop.fs.FileSystem.getLength(FileSystem.java:720)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1417)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1412)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.readPartitions(TeraSort.java:153)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:210)
    ... 15 more

Команды TeraGen работают нормально и создали входные файлы для TeraSort.Вот список моего входного каталога:

bin/hadoop fs -ls /user/hadoop/terasort-input/Warning: Maximum heap size rounded up to 1024 MB
Found 5 items
-rw-r--r--   1 sqatest supergroup           0 2012-01-23 14:13 /user/hadoop/terasort-input/_SUCCESS
drwxr-xr-x   - sqatest supergroup           0 2012-01-23 13:30 /user/hadoop/terasort-input/_logs
-rw-r--r--   1 sqatest supergroup         129 2012-01-23 15:49 /user/hadoop/terasort-input/_partition.lst
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00000
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00001

Вот моя команда для запуска terasort:

bin/hadoop jar hadoop-examples-0.20.203.0.jar terasort -libjars hadoop-examples-0.20.203.0.jar /user/hadoop/terasort-input /user/hadoop/terasort-output

Я вижу файл _partition.lst в моем входном каталоге, яне понимаю, почему я получаю FileNotFoundException.

Я следовал подробностям настройки, предоставленным по адресу: http://www.michael -noll.com / blog / 2011/04/09 / сравнительный анализ и стресс-тестирование-кластер-гадуп-кластер-с-терасортом-testdfsio-nnbench-mrbench /

Ответы [ 4 ]

0 голосов
/ 21 мая 2014

Я использую Cloudera CDH4. столкнулся с аналогичной проблемой с моей другой программой hadoop. считаю, что проблема связана со связыванием внешних библиотек.

Программа работала нормально в Eclipse (локальный режим), но когда я попытался запустить его в псевдораспределенном режиме, получило это сообщение об ошибке.

Временное решение: - Создан JAR-файл из Eclipse с опцией обработки библиотек - скопируйте необходимые библиотеки в подпапку рядом с сгенерированным JAR. - Скопировал JAR-файл в домашний каталог hadoop (путь к файлу hadoop-exampls.jar)

с этим исправлением я могу запустить программу hadoop без каких-либо ошибок. надеюсь, это поможет

0 голосов
/ 16 февраля 2012

Проблема возникла из-за того, что я развертывал задание в NFS.Я изменил hadoop.tmp.dir, чтобы он указывал на локальную файловую систему (/ tmp), и проблема исчезла в один миг.

0 голосов
/ 12 февраля 2013

Вы настроили работу в псевдораспределенном режиме (или в реальном кластере)?Если вы не настроите Hadoop, он будет работать в режиме локального запуска заданий (как libs внутри одного процесса) - Terasort НЕ работает в режиме LocalJobRunner.Найдите в выводе слово LocalJobRunner для проверки.

Вот ссылка на настройку HDFS, SSH и rsync: http://hadoop.apache.org/docs/r1.1.1/single_node_setup.html#PseudoDistributed

0 голосов
/ 08 февраля 2012

Я получил это для работы следующим образом:

Я работаю в локальном режиме из моего базового каталога hadoop, hadoop-1.0.0 с подкаталогом input под ним, и я получаю ту же ошибку, что и вы.

Я отредактировал сбойный Java-файл, чтобы он записывал путь вместо имени файла, перестраивал его («ant двоичный файл») и переписывал его.Он искал файл в каталоге, из которого я работал.Я понятия не имею, просматривал ли он базовый каталог hadoop или каталог выполнения.

... поэтому я сделал символическую ссылку в каталоге, в котором я запускаю terasort, указывая на реальный файл во входном каталоге.

Это дешевый хак, но он работает.

- Tim.
...