Мы сталкиваемся с проблемой небольших файлов в разделе, вызывающей неравномерное распределение и...
При запуске моего приложения scala-spark я получаю следующее исключение: 19/02/22 11:27:48 WARN...
У меня есть 2 файла в разных форматах.Один - SequenceFileInputFormat, другой - TextInputFormat.Я...
У меня есть каталог ресурсов HDFS и каталог назначения архива в HDFS.В начале каждого запуска моей...
Я использую pyspark [spark2.3.1] и Hbase1.2.1, мне интересно, как лучше всего получить доступ к...
У меня есть XML-файл в HDFS, я хочу загрузить эти XML-файлы в таблицу HBase. Я ссылался на...
Я создал таблицу в схеме Avro. Вот сценарий создания. CREATE TABLE `old_db.MyTable`( `fileld1`...
При вызове API YARN REST через curl, чтобы получить задания в кластере, используя: curl --negotiate...
Предположим, что ведомой базы данных нет.Очень высокий риск прямого использования sqoop для...
Я перешел по нескольким ссылкам, но ни одна из них не работает.Я действительно хочу, чтобы мой...
Я читаю данные из таблицы hbase в кусте. В первом столбце hbase имеет некоторые значения ascii,...
Введение: Я использую Ubuntu 18.04.2 LTS, на которой я пытаюсь настроить кластер Hadoop 3.2 с одним...
Я установил небольшой кластер Hadoop 2.7, Hbase 0.98 и Nutch 2.3.1.Я написал специальное задание,...
Я имею команду импортировать sql из sqlserver в hive, как показано ниже sqoop import --connect...
Я новичок в Java и Hadoop. Я пытаюсь запустить скрипт из командной строки и не совсем понимаю...
Есть ли модуль или коннектор, который позволяет Python напрямую обращаться к таблицам Hive?Любая...
Я пытался установить hadoop-3.2.0 на Linux Mint.Все идет хорошо.Также java 11.0.2 устанавливается...
К сожалению, я укоротил стол в улье, и мусор был очищен.Есть ли способ получить данные обратно....
Я сталкиваюсь с этой проблемой: у нас есть общий пользователь, где мы используем impala-shell с...
Я пытаюсь выполнить файл WordCount.jar на кластере Hadoop с одним узлом. Но когда я пытаюсь...
я столкнулся со следующей ошибкой при выполнении моего SQL-запроса в Zeppelin с интерпретатором...
Я пытаюсь создать задание Sqoop с инкрементным последним изменением, но оно выдает инструмент...
Мы наблюдаем непостоянную производительность для файловых методов put / get в HDFS. Мы загружаем...
Пожалуйста, вы можете мне помочь?После настройки искрового интерпретатора для работы в кластере...
В моей таблице HBase каждая строка может иметь столбцы, отличные от других строк.Например; ROW...