У меня есть несколько основных вопросов о последовательном файле hadoop.
1) В какой степени кодек сжатия по умолчанию сжимает файл?
2) У меня есть файл последовательности hadoop размером 100 МБ, когда я читаю этот файл и выгружаю его содержимое в текстовый файл.
3) При чтении файла последовательности значение "syncSeen ()" и
"seek (длинная позиция)" ? Есть ли проблема, если я не использую эти звонки во время чтения?
любой пример о том, как использовать эти методы?