Вопросы с тегом hadoop - PullRequest

Вопросы с тегом hadoop

0 голосов
2 ответов

У меня есть две таблицы в Hive: user и item, и я пытаюсь вычислить косинусное сходство между двумя...

Ivan / 21 февраля 2019
0 голосов
1 ответ

Я давно искал способ получить все имена файлов в каталоге и его подкаталогах в файловой системе...

Harelz / 21 февраля 2019
0 голосов
1 ответ

Я устанавливаю hadoop по brew install hadoop, а затем использую pip install pyarrow в качестве...

wyx / 21 февраля 2019
0 голосов
1 ответ

Приложение Spark выдает эту ошибку: > Cannot create directory > /home/user/hdp/

M. Braga / 21 февраля 2019
0 голосов
0 ответов

Мне нужно обновить JDK с oracleJDK7 до OpenJDK7 для Hbase (версия 1.2.6) и Hadoop (версия 2.7.3)

Roshan / 21 февраля 2019
0 голосов
0 ответов

Мне удалось запутать свою программу Word Count, и теперь я хочу получить максимальное количество...

Namorange / 21 февраля 2019
0 голосов
0 ответов

Я администратор кластера, где есть более 100 серверов Region для HBase и более 50 таблиц, которые...

Mahadevan / 21 февраля 2019
0 голосов
0 ответов

У меня есть файл объемом 2 ГБ (скажем, avro), сжатый с помощью BZip2 (splittable), и у меня точно...

Shashank S / 21 февраля 2019
0 голосов
0 ответов

Я использую Beeline для подключения с одного сервера на другой и получения данных из Hive. Я...

Joe / 21 февраля 2019
0 голосов
0 ответов

Я создал экземпляр AWS EC2 с запущенным на нем Hadoop-2.7.3 с большинством конфигураций по...

Chauhan B / 20 февраля 2019
0 голосов
0 ответов

У меня есть файл hdfs со следующими данными key1=value1 key2=value2 key3=value3... key1=value11...

Dharanidhar / 20 февраля 2019
0 голосов
0 ответов

Я сделал тест с distCp, но я понимаю, что он служит только для копирования между кластерами hdfs.В...

ivan rodriguez / 20 февраля 2019
0 голосов
0 ответов

Я использую следующую конфигурацию hadoop-metrics2.properties: *.sink.graphite.class=org.apache

aryndin / 20 февраля 2019
0 голосов
0 ответов

Как настроить псевдо-кластер Hadoop (кластер с одним узлом) и использовать его?Например, если у нас...

Rahul Raj / 20 февраля 2019
0 голосов
1 ответ

У меня есть задание Spark Streaming, которое при запуске запрашивает Hive и создает объект Map [Int...

CatchingMonkey / 20 февраля 2019
0 голосов
1 ответ

Наши платформы MySQL и Hadoop развернуты в разных сетях, Hadoop не может посещать MySQL, но MySQL...

user2894829 / 20 февраля 2019
0 голосов
0 ответов

Как Hadoop по-разному устанавливает значения ресурсов для каждого контейнера? Версия Hadoop: 2...

vito kim / 20 февраля 2019
0 голосов
1 ответ

У меня есть строка, семейство столбцов h1 с двумя значениями id и name в таблице "hbase"...

Lakshminarayana / 20 февраля 2019
0 голосов
1 ответ

У меня есть задание ETL, где я хочу добавить данные из CSV-файла в таблицу Impala.В настоящее время...

Ken Wei / 20 февраля 2019
0 голосов
0 ответов

Я пытаюсь запустить hadoop ls через python.код:) тоже, но бесполезно.могут ли некоторые вести меня,...

Jeevan / 20 февраля 2019
0 голосов
2 ответов

Я хочу развернуть spark2.3.2 на Yarn, Hadoop2.7.3. Но когда я запускаю: spark-shell Всегда повышать...

Skateboard / 20 февраля 2019
0 голосов
1 ответ

У меня есть файл, хранящийся в HDFS, и мне нужно узнать его размер.Я использовал следующую строку в...

Clock Slave / 20 февраля 2019
0 голосов
0 ответов

У меня есть 4 системных кластера, и Apache Nutch 2.3.1 настроен для сканирования нескольких...

Shafiq / 20 февраля 2019
0 голосов
0 ответов

Как определить ресурсы кластера Hadoop, использованные завершенным заданием? Наш менеджер ресурсов...

Kode Charlie / 20 февраля 2019
0 голосов
1 ответ

Это уже было предметом обсуждения в предыдущем посте , однако я не убежден в ответах, поскольку...

The Phoenician / 20 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...