Я столкнулся с той же проблемой, используя Mahout 0.5.Я думаю, проблема в том, что параметр normPower используется в обеих функциях.Попробуйте код, подобный этому.
DictionaryVectorizer.createTermFrequencyVectors(tokenizedPath,
outputDir, conf, minSupport, maxNGramSize,
minLLRValue,
-1.0f, // no normalization here
logNormalize, numReducers, chunkSize,
sequentialAccessOutput, namedVector);
TFIDFConverter.processTfIdf(vectorOutput, new Path(outputDir,
"tfidf"), conf, chunkSize, minDf,
maxDFPercent,normPower,
logNormalize, sequentialAccessOutput, namedVector,
numReducers);
После этого у меня прекратились проблемы с пустыми кластерами.