Как файлы в HDFS и в локальных файловых системах ext4 соответствуют друг другу?
Согласно Нужно ли создавать / tmp и / user / hive / warehouse?
В файловой системе hdfs создаются каталоги '/ tmp' и '/ user / hive / warehouse'.Вы не можете видеть эти папки, используя команды локальной файловой системы.
Эта папка /tmp
в вашей локальной файловой системе поддерживается операционной системой и используется для хранения временных файлов.Не относится к hdfs.
Я думал, что
файлы в HDFS и файлы в локальных файловых системах ext4 не являются одинаковыми файлами и не зависят отдруг с другом, за исключением того, что, возможно, файлы в HDFS реализованы в некоторых других файлах в локальной файловой системе ext4.
файловая система HDFS по умолчанию должна быть пустой без какого-либо файла, и чтобы добавить в нее файл, мне нужно было бы добавить файлы в файловую систему HDFS с помощью команды hadoop fs
.
Но меня смущают следующие примеры:
Пример 1: Я обнаружил, что
$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp
mkdir: `/tmp': File exists
и
$HADOOP_HOME/bin/hadoop fs -ls /tmp
показывают те же файлы, что и ls -l /tmp
в моей локальной файловой системе ext4.
Почему файловая система HDFS по умолчанию содержит каталог /tmp
моей локальной файловой системы ext4, при этом я явно не запускаю hadoop fs
для добавления /tmp
в файловую систему HDFS?
Пример 2:
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse
mkdir: `/user/hive/warehouse': No such file or directory
и в моей локальной файловой системе ext4 в Ubuntu нет /usr/hive/warehouse
.
Если я создаю /usr/hive/warehouse
в файловой системе HDFS
$ sudo env "JAVA_HOME=$JAVA_HOME" $HADOOP_HOME/bin/hadoop fs -mkdir -p /user/hive/warehouse
почему он также создает /user/hive/warehouse/
в моей локальной файловой системе ext4
$ ls -ld /user/hive/warehouse/
drwxr-xr-x 2 root root 4096 May 14 05:30 /user/hive/warehouse/
Зависит ли ответ на поставленные вопросы от того, зависит ли мойHadoop находится в локальном режиме, псевдораспределенном режиме и распределенном режиме?Если да, то как файлы в HDFS и в локальных файловых системах ext4 соответствуют друг другу в локальном режиме, псевдораспределенном режиме и распределенном режиме соответственно?
Я скачал hadoop-3.1.2 в свою Ubuntu с файловыми системами ext4.
Я слышал
HDFS может работать в локальном режиме, псевдораспределенном режиме и распределенном режиме.
по умолчанию,HDFS работает в локальном режиме.
Я не внес никаких изменений в конфигурации Hadoop, поэтому я думаю, что HDFS работает в локальном режиме, хотя я хотел бы знать, как это проверить(как?).