Сценарий:
Я импортировал данные с SQl Server в HDFS.Данные, хранящиеся в каталоге HDFS в нескольких файлах:
part-m-00000
part-m-00001
part-m-00002
part-m-00003
Вопрос:
Мой вопрос таков: при чтении этих сохраненных данных из каталога HDFS мы должны прочитать весь файл (part-m-00000,01,02,03
) или просто part-m-00000
.Потому что, когда я прочитал эти данные, я обнаружил, что данные внутри HDFS немного отсутствуют.Так это случилось или я что-то упустил?