У меня есть файлы ORC в HDFS, которые мне нужно передавать в BLOB-контейнер Azure безопасным...
Я пишу / читаю spark dataframes в удаленный кластер hdfs в Linux. dataFrame.select("col1"...
безопасно ли удалять папку / tmp / hive / hive ?(из hdfs) as (от пользователя hdfs) hdfs dfs -rm -r...
У меня возникла серьезная проблема с производительностью во время отклика HDFS namenode (v2.7).В...
Я пытаюсь прочитать файл паркета с помощью Impala. impala-shell> SELECT * FROM `/path/in/hdfs/*
В Impala в конце оператора CREATE TABLE вы можете установить коэффициент репликации, как я понимаю:...
Это моя первая неделя с Hive и HDFS, поэтому, пожалуйста, потерпите меня. Почти все способы,...
У меня уже есть таблицы базы данных mySql, импортированные в hdfs с использованием sqoop.База...
Вот мои результаты jps на главном узле. NameNode SecondaryNameNode И вывод подчиненного узла jps...
Как заголовок, для datanode в режиме реального времени всегда требуется около 20 минут или больше.Я...
Я использую потоковую обработку искры для обработки данных с конфликтующей платформы и записи в...
У меня есть простой блок кода для записи, а затем чтения данных в формате Avro. Поскольку Avro lib...
Я могу прочитать обычный файл с: textFile = sc.textFile("README.md") , но как прочитать...
Я могу запустить эту команду для HDFS: hadoop fs -ls /user/hive/warehouse/databasename.db/tablename...
В моем кластере HDFS три датодода.Два имеют емкость диска 1,4 ТБ, а другой - 500 ГБ. Проблема в том...
Какова наилучшая практика подключения Splunk к Hadoop или другим платформам данных, является ли...
Я занимаюсь копированием данных Hadoop на S3.И изучил другой вариант. Я узнал, что мы можем...
Я установил Hadoop на виртуальную машину Ubuntu. Я настроил HDFS, и я могу получить к нему доступ...
Мне нужно скопировать каталог из одного hdfs-пути в другой.Однако я сталкиваюсь с отсутствием...
У меня есть данные, сохраненные как один раздел в HDFS (в байтах), и когда я хочу получить...
Я пытаюсь использовать соединитель kafka для записи данных в Hive с форматом OCR с шины Kafka....
Я выполнил задание потокового воспроизведения, которое опрашивает массаж от Кафки и сохраняет его в...
У нас большой кластер Hadoop и недавно установлен Elastic Search для оценки. Теперь мы хотим...
Требуется конечная точка API для сбоев узлов данных для Cloudera Manager / CDH URL: http://cloudera
Какова лучшая практика для работы с Vertica и Parquet Моя архитектура приложения: Kafka Topic (Avro...