я пытаюсь выполнить следующий код на zepplin df = spark.read.csv('/path/to/csv') df
Я новичок в Hadoop, и недавно я настроил Hadoop 3.1.2 в Ubuntu 18.04.Я могу запустить службы...
Я не могу понять, как spark определяет количество разделов при чтении из AWS S3 Мой случай: Я...
Hadoop предоставляет Configured и Configurable, чтобы классы могли получить доступ к Configuration...
Мои rowKeys в HBase вот так; a1s1 a1s2 a1s3 a2s1 a3s1 a3s2 ... Я хочу получить только эти данные;...
Фон У меня есть приложение для потокового воспроизведения (написано в scala), которое считывает...
Я беру некоторые записи JSON из файла.Я хочу проанализировать json, а затем, основываясь на поле в...
У меня есть идентификатор задания hadoop job_xxxx_xxxx, который уже завершен и перемещен на сервер...
был бы признателен за несколько дополнительных глаз;Я не могу понять, почему этот запрос не...
У меня есть внешняя таблица Hive, хранящая данные как паркет в HDFS;данные извлекаются из другой...
Я пытаюсь добавить данные Чикаго Преступления, которые находятся в HDFS...
Первое уменьшение карты - map ( key, line ): read 2 long integers from the line into the variables...
Я установил спарк 2.3.3 на Windows 8.1.Я установил переменные env: JAVA_HOME и HADOOP_HOME и...
Я установил Sqoop2 и могу запустить и запустить сервер, но когда я использую оболочку для запуска...
Я пытаюсь установить PIG 0.17, используя windows и cygwin.Когда я выполняю следующую команду: pig...
Hadoop FileSystem поддерживает выборку объектов S3 с использованием S3A-коннектора с URI, например...
Я настраиваю новую среду hadoop на сервере с 2-мя машинами.Когда я запускаю dfs и пряжу и запускаю...
Я запустил скрипт импорта scoop для переноса данных из mysql в hdfs.Диагностика показывает...
Я следовал официальной и цифровой документации DigitalOcean (учебник), но не мог последовать их...
Я очень новичок в Hadoop, теперь я использую псевдораспределенную модель на одной машине и хочу...
Я пытаюсь пропустить создание индексов строк при создании файла ORC с использованием Java. OrcFile
Я пытаюсь найти диаграмму, которая показывает поток заданий MapRedude в случае операции записи...
У меня есть таблица кустов, которая создается с помощью следующего кода: CREATE TABLE IF NOT EXISTS...
Я использую приведенный ниже код сокращения карты для вычисления суммы и средней длины слов,...
Мой кластер hadoop состоит из 2 машин: master - это AWS t2.medium Ubuntu мой персональный ноутбук...