У меня есть таблица улья, которая служит моей исходной таблицей. У меня также есть еще одна таблица...
Я новичок в hadoop, и я пытался запустить сокращение карты для простого входного файла (см. Пример)
У меня кластер из 5 машин: 1 большой NameNode 4 стандартных узла данных Я хочу изменить свой...
Мои данные: User id product_id action 1 apple incart 1 apple purchased 1 banana incart 2 banana...
Я получаю ошибку при вставке данных в таблицу кустов, но данные успешно вставляются в таблицу. act...
Мой вопрос о том, могу ли я / как использовать mapreduce.RowCounter в автономной базе данных. Я...
Я новичок в Hadoop. Моя версия hadoop - 2.8.1, и я использую Eclipse Oxygen 3a. Я пытаюсь...
когда я запускаю демон hadoop, я получаю следующую ошибку [hdp@localhost ~]$ start-all.sh WARNING:...
У меня есть следующий фрагмент кода для записи и чтения файла ORC. Во время записи для каждой 100-й...
ModuleNotFoundError Traceback (most recent call last) <ipython-input-13-93a644f2878c> in...
У меня есть данные некоторых телефонных записей ниже, я хочу удалить первые два значения из каждой...
Я пытаюсь понять, как именно работает ALTER TABLE CONCATENATE в HIVE. Я видел эту ссылку Как...
Я пытался импортировать данные из mysql в hdfs. Я смог сделать это с sqoop, но это можно сделать,...
У меня есть таблица Hive, в которой имя столбца date содержит значения в формате «гггг-мм-дд чч:...
Когда я загружаю данные Elasticsearch в Spark DataFrame с помощью PySpark, я получаю следующую...
Я хотел бы сохранить огромный фрейм данных pyspark в виде таблицы Hive. Как я могу сделать это...
У меня есть кластер с 1 ведущим и 4 подчиненными. Вот мой конфиг: nodemanager yarn.nodemanager
У меня есть внешняя таблица в кусте, которая имеет report_dt в качестве столбца и тип данных string...
Мы работаем с 3-узловым кластером AWS EMR (1 NameNode, 2 DataNodes). Наблюдается, что указание...
Обратите внимание на порт 9000 ниже. Он открыт для локального хоста, но не для внешнего IP....
как я могу подключиться к песочнице hortonworks (2.5) через ssh? ssh maria_dev@127.0.0.1 Я получил...
Я пытаюсь разбить некоторые файлы журнала, используя R через пакеты 'rhdfs' и 'rmr2'. источник...
У меня есть доступ к кластеру Hadoop, где у меня есть только для чтения доступ к папке hdfs, где...
public static class TokenizerMapper extends Mapper<Object, Text, Text, Text> { public void...
Вы видите, что ambari services запуск занимает много времени, как я могу сделать его быстрее?