Question

Загрузил почти 50 ГБ CSV-файла в кластер Hadoop, и я хочу посмотреть некоторые примеры записей для идентификации столбцов.

Я пытался использовать

hadoop fs -cat employees.csv | head -n 10

Мои вопросы

это правильная команда для просмотра данных?
head -n 10 - он загрузит 50 ГБ данных и отфильтрует первые 10 строк? как это работает?
любой другой лучший подход?

Istvan · Answer 1 · 05 апреля 2019

Это зависит от вашей версии.

Для более старых версий Hadoop (<3.1.0): </p>

hadoop fs -cat employees.csv | head -n 10

Для более новых (> = 3.1.0) версий Hadoop

 hadoop fs -head employees.csv

Каков наилучший способ увидеть формат данных в Hadoop HDFS?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.