Запуск теста сортировки
Чтобы использовать пример сортировки в качестве эталона, создайте 10 ГБ / узел случайных данных, используя RandomWriter.Затем отсортируйте данные, используя пример сортировки.Это обеспечивает критерий сортировки, который масштабируется в зависимости от размера кластера.По умолчанию в примере сортировки используется число 1,0 * для количества сокращений, и в зависимости от кластера вы можете получить лучшие результаты при емкости 1,75 *.
Команды:
$> bin/hadoop jar hadoop-*-examples.jar randomwriter /path/randFiles
$> bin/hadoop jar hadoop-*-examples.jar sort /path/randFiles /path/resultFile
Первая команда сгенерирует несортированные данные в каталоге rand.Вторая команда будет читать эти данные, сортировать их и записывать в каталог rand-sort.