У меня очень и очень странная проблема, поэтому любая помощь будет высоко оценена. На одном сервере...
В EMR я использую s3-dist-cp --groupBy, чтобы присвоить файлу случайное значение fileName в папке с...
если у меня есть класс Main, я хочу прочитать регистры таблицы de Hbase, как настроить класс Job,...
Почему я должен преобразовать СДР в ДФ, чтобы записать его как паркет, авро или другие типы?Я знаю,...
Я делаю Hadoop Java для своего проекта. Я могу просмотреть выходные данные для двух компаний (всего...
У меня была задача создать Java-программу, которая "MapReduce" представляет собой определенную...
есть ли способ в Sqoop получить все столбцы, кроме одного, из SQL Server в Hadoop.Я не хочу писать...
У меня есть набор данных, который структурирован так: [user_id, title, country, platform, language]...
Я создал процесс sqoop, который импортирует данные из MS SQL в Hive, но у меня проблема с полями...
Сбой соединения кустов с ошибкой MapredLocalTask (другие люди уже упоминали, что обходной путь...
Я хочу создать демонстрационную таблицу, например, с именем Teacher и указать количество версий,...
Я играю с PySpark со следующим кодом: from pyspark.sql import SparkSession spark = SparkSession
Я пытаюсь ознакомиться с заданиями Hadoop / Hbase MapReduce, чтобы иметь возможность их правильно...
У нас есть запрос, который использует несколько внутренних соединений Теперь здесь мы выполняем...
Я установил Hadoop 3.1.2 в Ubuntu как один узел.Я пытаюсь запустить пример WordCount, который...
Загрузил почти 50 ГБ CSV-файла в кластер Hadoop, и я хочу посмотреть некоторые примеры записей для...
Мы работаем с BigData, используя Hadoop my Virtual Box с CentOS. всякий раз, когда мы выполняем...
Я пытаюсь запустить кластер hadoop под docker, запустив start-dfs.sh в namenode. Все запускается...
Вот схема таблицы, которую я имею CREATE DATABASE IF NOT EXISTS mydb; USE mydb; CREATE TABLE IF NOT...
У меня есть набор файлов в HDFS, эти файлы твиты. Мне нужно транслировать эти твиты через...
Я использую мультитенантное решение, размещенное в EMR, в котором работает Spark Cluster. Многие...
Текущий сценарий: У меня есть этот запрос, который объединяет все два набора данных и затем...
Я новичок в Hadoop. Теперь мне нужно установить клиент для кластера hadoop других, который является...
Я пытаюсь прочитать файл с s3 с моего ноутбука через IntelliJ, чтобы я мог легче разработать свою...
Я занимаюсь анализом исторических данных с открытым исходным кодом (7 ТБ) данных полета opensky....