Контекст У меня есть две таблицы, к которым я присоединяюсь / объединяюсь как часть моих искровых...
As per distcp documentation -> If -pa is specified, DistCp preserves the permissions also...
В настоящее время я использую Apache Parquet-Mr (Java) для обработки файлов Parquet. Я...
Я запускаю следующий файл hiveql со следующим содержимым set mapred.output.compress=true; set hive
Я обновил нашу систему HDP (Hortonworks Data Platform) с 2.5.2 до новейших версий (2.6.5). Все...
Я создал таблицу в улье. не внешний , структура таблицы остается такой же, как у файла, который...
Я писал данные на Hadoop и куст в формате паркета, используя спарк. Я хочу включить сжатие, но я...
Я пытаюсь импортировать данные из базы данных SAP Hana в hadoop с помощью команды импорта sqoop, но...
Может ли Apache Impala установить / запустить на EC2 (а не на EMR) чтение данных из S3? Или для...
Я очень новичок в Hadoop и пытаюсь использовать «вычисляемое» поле, как в SQL: SELECT...
У меня есть требование, когда мне нужно создать собственную команду Hbase Shell и вызвать метод...
Я понимаю возможности Spark / Hadoop для работы с большими данными, но меня просят использовать их...
Я получил это сообщение: WorkerSinkTask{id=hdfs-test-0} Sink task finished initialization and start...
Я пытаюсь выполнить эту команду: aymenstien@aymenstien-VPCEH2Q1E:/usr/share/logstash$
Я создал блокнот в Jupyter SPARK_MAJOR_VERSION=2 PYSPARK_DRIVER_PYTHON=jupyter...
Итак, я сейчас пишу импала-запрос, который по существу группирует данные, основанные на нескольких...
Я новичок в Hadoop домене. Я хочу знать о системных требованиях для настройки среды hadoop. Мой...
Я запускаю штормовую банку в кластере, где я настроил hadoop, kafka, штормовую группу когда я...
Вариант использования: Datastax DSE Cluster под управлением Cassandra, HiveMetastore (на основе...
Когда я запускаю команду sqoop export из терминала, она работает нормально. Но если я запускаю ту...
Я недавно преобразовал кластер HDP (2.6.2) в HDInsight 3.6 (ранее 3.5). С этого момента мои сиськи,...
Добрый день, коллеги. У меня большой набор данных (около 237 000 000 строк). Есть много столбцов....
У нас есть сервер улья для хранения больших данных, которые мы хотим использовать. Таблица хранится...
У нас есть кластер hadoop с настроенным честным планировщиком. Мы привыкли видеть сценарий, когда в...
У меня есть несколько таблиц в Hive, каждый день новый csv-файл будет добавляться в расположение...