Это известная ошибка, а вот JIRA .Ошибка была обнаружена в Hadoop 0.21.0, но я не думаю, что она есть в какой-либо версии релиза Hadoop.Если вы действительно хотите это исправить, вы можете
- скачать исходный код для Hadoop (для выпускаемого вами релиза)
- скачать патч из JIRA и применить его
- сборка и тестирование Hadoop
Вот инструкции о том, как применить исправление.
Или вместо использования IdentityMapper и IdentityReducder,используйте сценарии python / perl, которые будут считывать пары k / v из STDIN, а затем записывать те же самые пары k / v в STDOUT без какой-либо обработки.Это похоже на создание собственного IdentityMapper и IdentityReducder без Java.