Добавляет ли файл последовательности hadoop фиктивные данные к нему - PullRequest
0 голосов
/ 03 мая 2018

В моем случае я пытаюсь объединить все данные файлы изображений в файл последовательности hadoop, чтобы избежать проблемы маленьких файлов. Поэтому я сначала создал файл последовательности с помощью приложения картографирования. Ключом каждого файла изображения является путь к нему, а соответствующее значение будет байтовым массивом файла изображения. При записи изображения в файл последовательности размер байтового массива изображения, скажем, 14k. Всякий раз, когда я пытаюсь прочитать значение из файла последовательности (вывод первого преобразователя) с помощью другого преобразователя, размер читаемого байтового массива резко увеличивается, скажем, до 500К. Не знаю, где проблема. Пожалуйста, помогите мне с этим.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...