У меня есть две таблицы в Hive: user и item, и я пытаюсь вычислить косинусное сходство между двумя...
Я давно искал способ получить все имена файлов в каталоге и его подкаталогах в файловой системе...
Я устанавливаю hadoop по brew install hadoop, а затем использую pip install pyarrow в качестве...
Приложение Spark выдает эту ошибку: > Cannot create directory > /home/user/hdp/
Мне нужно обновить JDK с oracleJDK7 до OpenJDK7 для Hbase (версия 1.2.6) и Hadoop (версия 2.7.3)
Мне удалось запутать свою программу Word Count, и теперь я хочу получить максимальное количество...
Я администратор кластера, где есть более 100 серверов Region для HBase и более 50 таблиц, которые...
У меня есть файл объемом 2 ГБ (скажем, avro), сжатый с помощью BZip2 (splittable), и у меня точно...
Я использую Beeline для подключения с одного сервера на другой и получения данных из Hive. Я...
Я создал экземпляр AWS EC2 с запущенным на нем Hadoop-2.7.3 с большинством конфигураций по...
У меня есть файл hdfs со следующими данными key1=value1 key2=value2 key3=value3... key1=value11...
Я сделал тест с distCp, но я понимаю, что он служит только для копирования между кластерами hdfs.В...
Я использую следующую конфигурацию hadoop-metrics2.properties: *.sink.graphite.class=org.apache
Как настроить псевдо-кластер Hadoop (кластер с одним узлом) и использовать его?Например, если у нас...
У меня есть задание Spark Streaming, которое при запуске запрашивает Hive и создает объект Map [Int...
Наши платформы MySQL и Hadoop развернуты в разных сетях, Hadoop не может посещать MySQL, но MySQL...
Как Hadoop по-разному устанавливает значения ресурсов для каждого контейнера? Версия Hadoop: 2...
У меня есть строка, семейство столбцов h1 с двумя значениями id и name в таблице "hbase"...
У меня есть задание ETL, где я хочу добавить данные из CSV-файла в таблицу Impala.В настоящее время...
Я пытаюсь запустить hadoop ls через python.код:) тоже, но бесполезно.могут ли некоторые вести меня,...
Я хочу развернуть spark2.3.2 на Yarn, Hadoop2.7.3. Но когда я запускаю: spark-shell Всегда повышать...
У меня есть файл, хранящийся в HDFS, и мне нужно узнать его размер.Я использовал следующую строку в...
У меня есть 4 системных кластера, и Apache Nutch 2.3.1 настроен для сканирования нескольких...
Как определить ресурсы кластера Hadoop, использованные завершенным заданием? Наш менеджер ресурсов...
Это уже было предметом обсуждения в предыдущем посте , однако я не убежден в ответах, поскольку...