Я пытаюсь очистить «грязные» даты и преобразовать их в формат день-месяц-год через функцию.Я...
Я пытаюсь просмотреть каждую строку в столбце «рождение» Проверьте, заканчивается ли последняя...
Я запускаю искровое приложение на экземплярах Amazon Spot. В конце я экспортирую свои результаты в...
Я хочу указать местоположение input folder в GetFile процессоре в NiFi. Указанный мною путь неверен...
Мой пример использования: у меня есть два источника данных: 1. Source1 (как скоростной слой) 2....
У меня есть огромный фрейм данных dask с 100 разделами, который читает файл 100 json из gcs: dd =...
Мы работаем над проектом по декодированию файлов сообщений в реальном времени, которые передаются...
Я создал кластер EMR с конфигурацией hadoop, Sqoop и Spark.Я пытаюсь импортировать Sqoop, но...
Я создал экземпляр VM на google cloud platform, в который я установил NiFi.Существует два типа...
Я пытаюсь установить / собрать Apache Accumulo. Я использую http://mirror.olnevhost
Мне нужно прочитать файл с фиксированной шириной 10 ГБ на фрейм данных.Как я могу сделать это,...
Я хочу скопировать данные из hdfs в s3 напрямую, без использования distCp. Как мне это сделать?...
Я пытаюсь использовать pySpark AWS Glue для обработки данных / очистки данных. Данные в формате CSV...
У меня есть огромный набор данных, который должен выполнить двоичную классификацию. Некоторые...
При использовании пакета R RecordLinkage некоторые выходы, следующие за функциями epiClassify() или...
Я хочу сгенерировать автоматическое объединенное значение в таблице базы данных, мне нужно...
Я пытался выполнить операцию сохранения в режиме pig hdfs, но он выдает следующее сообщение об...
Я использую открытый исходный код Zookeeper 3.4.13 и открытый исходный код HBase 2.1.3.Я установил...
У меня есть большой (30 ГБ) файл твитов json, который я хотел бы проанализировать и провести...
Моя цель - переместить json/xml файлы из Azure в Google Cloud Platform(GCP), используя NiFi. После...
В моей таблице улья есть столбец, тип данных которого является логическим. когда я пытался...
Итак, сегодня я заметил странное поведение моего кода уменьшения карты.Потратил 3 часа, пытаясь...
У меня проблема с цепочкой Mapper >> Редуктор >> Редуктор Это мои данные: Dpt.csv EmpNo1, DeptNo1...
Я прочитал это, "... Оператор упорядочения должен буферизовать все элементы, которые он получает....
Попытка выполнить следующую команду: sqoop import --connect jdbc:mysql://---.--.--