Привет всем, я пытаюсь импортировать некоторые данные с сервера SQL на hbase и создать таблицу на...
"in" Пример: select * from t where something in ('a', 'b', 'c') "или"...
Я пытаюсь читать в файлах для обработки текста. Идея состоит в том, чтобы запустить их через...
Предположим, у меня есть следующая схема в таблице csv или sql: id (INT) content_type (VARCHAR)...
У меня есть таблица в Hive, в которой есть имя столбца со специальным символом "#" Как мне выбрать...
Привет, новичок в Apache Hive, Установлен в Ubuntu 18.04 и может запускать 'show tables;'Команда....
Я пытаюсь установить Hadoop на мой компьютер с Windows 7.Я делаю это впервые и следую инструкциям...
Я не могу импортировать Tensorflow в Pysark2.Я получаю следующую ошибку Python 3.4.8 (default, Apr...
У меня есть некоторые данные в таблицах Hbase (несколько миллиардов).Я должен обработать их, чтобы...
Недавно мне не удалось загрузить какие-либо jar-файлы в мой кластер Flink, работающий под YARN в...
У меня есть инструмент, который использует org.apache.parquet.hadoop.ParquetWriter для...
На самом деле, поскольку Hive не поддерживает OFFSET (не уверен), и я ограничил свой результат...
У меня возникла проблема с созданием таблицы в Hue после того, как я сделал кучу временных
У меня есть сценарий, где у меня есть данные, как показано ниже: Customer ID | Customer Name |...
При использовании FileSystem.get(URI.create("hdfs://localhost:9000/"), configuration) я...
У меня есть кластер с установленным hadoop: hadoop version Hadoop 3.1.1.3.0.1.0-187 Source code...
Я запускаю Spark Streaming на EMR 5.19, и случайно мои потоковые микробатчи Spark продолжают...
Я работаю с Spark.SQL и пытаюсь создать сводную таблицу с помощью оператора MAP, чтобы значения...
У меня есть таблица иерархии, есть уровень организации Родительские дочерние отношения.а другая...
У меня есть 2 входных файла (один в JSON, а другой в паркетном), я пытаюсь объединить эти 2 больших...
Я пытаюсь вставить данные в управляемую таблицу Hive, в которой есть раздел. Показать выходные...
Файлы ORC и Parquet сами по себе (без других параметров сжатия, например, snappy) имеют эффекты...
Я пытаюсь настроить Apache Nutch для записи в Apache Kudu, но нигде не могу найти информацию о том,...
Существует ли максимальное количество подчиненных узлов, которые необходимо настроить для кластера...
Я пытаюсь настроить вызов HDFS, чтобы получить файл из него, используя FileSystem, чтобы сделать...