Я хочу получить количество таблиц для всех таблиц в папке с именем "Planning" в базе данных кустов...
Я хочу прочитать CSV-файл, доступный для сервера Sftp, используя плагин cdap source. Я обнаружил...
Найдите путь файла jar hadoop-streaming-1.2.1.jar в Google File Platform. https://github
Я новичок в cloudera и пытаюсь использовать sqoop в виртуальной машине cloudera quickstart. Я...
Какой из них лучше (с точки зрения производительности и работы в долгосрочной перспективе) в...
Данные в таблице mySql имеют имя и адрес из 2 столбцов с полем адреса, содержащим запятую (,)....
Вот мой вариант использования: У меня есть некоторые данные, хранящиеся в Hadoop (файлы HDFS, а...
Я запустил спарк-оболочку, но не смог. 2019-11-03 01:13:55,602 WARN util.Utils: Your hostname,...
Я понимаю, что когда искра не может поместить все данные в памяти в свой раздел для выполнения...
У меня есть сценарий, в котором все контейнеры (около 50) должны быть все время запущены для...
Я работаю над кластером Azure HDInsight для обработки больших данных. Несколько дней назад я создал...
Если у меня есть своя собственная пользовательская файловая система Hadoop, доступная для...
есть ли у вас опыт использования https://github.com/jetoile/hadoop-unit и https://github
У меня есть два отдельных вопроса относительно установки следующего: 1) Я хочу установить HUE. Но...
Я использую код ниже CREATE EXTERNAL TABLE IF NOT EXISTS dev_raw_static_file.us_visits ( `visit_id`...
Я создаю Hadoop Cluser для приведенной ниже конфигурации. Версия Hadoop: - Hadoop 3.1.2 Версия...
У меня есть один сценарий pyspark, и я хочу, чтобы этот сценарий выполнялся ежечасно, то есть после...
У меня есть кластер EMR, когда я запускаю Sqoop с одним маппером для передачи запроса 7 миллионов...
Я пытаюсь вставить данные в таблицу кустов с помощью интеграции штормовых ульев. Используемая...
Я хочу добавить префикс к некоторым таблицам улья, что-то вроде следующего: alter table sales_info...
Я пытаюсь compare two columns кадра данных, но это приводит к ошибке. Код PFB: if((df3.name==df3
Используя Java API, как определить общее количество сокращенных слотов текущего кластера? (Если я...
У меня проблема с моим кодом, это моя ошибка: Невозможно инициализировать MapOutputCollector org
При выполнении Spark-submit со статическим распределением количество порождаемых контейнеров больше...
У меня есть кластер HDP 3.1.0 , и я не могу использовать API REST сервера временной шкалы. Я вижу...