Фон У меня есть приложение для потокового воспроизведения (написано в scala), которое считывает...
Можем ли мы импортировать данные с помощью sqoop в hdfs и hive?Я пробовал это с двумя разными...
Я беру некоторые записи JSON из файла.Я хочу проанализировать json, а затем, основываясь на поле в...
У меня есть идентификатор задания hadoop job_xxxx_xxxx, который уже завершен и перемещен на сервер...
Я пытаюсь найти диаграмму, которая показывает поток заданий MapRedude в случае операции записи...
Я пытаюсь использовать Hadoop 3.1.1 на своем кластере.Я хотел бы поэкспериментировать с Кодом...
Мне нужна помощь по теме kafka, которую я хотел бы поместить в HDFS в формате паркет (с ежедневным...
Я пытаюсь использовать kafka-connect-hdfs, но, похоже, это не работает .. Я пытался возиться с...
Я тестирую производительность Dask, используя "Распределенные панды в кластере с Dask DataFrames" в...
У меня есть дата, разделенная на данные в улье.Однако файл в определенном разделе имеет имя,...
Мне нужно создать внешнюю таблицу кустов из местоположения hdfs, где один столбец в файле имеет...
Есть ли способ получить два первых файла из HDFS с помощью командной строки?Моя версия hadoop 2.7.3...
Мы получили данные от клиентов для обработки в Hadoop, во-первых, данные поступят в виде файла на...
Я создал пример данных опроса конвейера из MySQL и записал их в HDFS (в том числе в таблицу кустов)
При использовании FileSystem.get(URI.create("hdfs://localhost:9000/"), configuration) я...
Существует ли максимальное количество подчиненных узлов, которые необходимо настроить для кластера...
Предположим, что я удалил схему для существующей внешней таблицы улья, удалив таблицу, данные все...
Я писал программу MapReduce для устранения стоп-слов из заданного ввода, и мое программирование...
Существует ли какой-либо API низкого уровня в Hadoop, позволяющий нескольким задачам сокращения,...
Привет! Я использую Apache Drill версии 1.15 в распределенном режиме на 3 узлах с кворумом ZK из 3...
Каково влияние уменьшения коэффициента репликации HDFS до 2 (или только одного) на карте HBase /...
Я пытаюсь загрузить файл из моей локальной системы в Hadoop, чтобы я мог получить к нему доступ в...
Я использую Drill 1.15 в распределенном режиме только поверх узлов данных (3 узла с 32 ГБ памяти...
Я новичок в pyspark и у меня есть два отдельных файла .txt, каждый из которых является CSV с...
Я новичок в Hadoop. Возможно ли, что у меня есть два файла с одинаковой структурой, можно ли с...