Я работаю над простой программой сокращения карт, использующей набор данных Kaggle https://www
В моем проекте есть требование обрабатывать несколько файлов сообщений .txt с использованием...
В настоящее время clickhouse хранит данные по / var / lib / clickhouse пути, и я прочитал, что не...
Я записываю поток данных Kafka в ведущий приемник по пути HDFS.Кафка выдает строковые данные
Я использую версию 1.1 Kafka с подключением Kafka, и я сталкиваюсь с ошибкой, которую не понимаю.Я...
Я пытаюсь загрузить модель xgboost в формате .dat в скрипт pyspark напрямую из HDFS. Я пытался...
Есть ли команда HDFS, чтобы проверить, имеют ли 2 каталога в HDFS общий родительский каталог....
У меня есть дамп файла базы данных postgreSQL размером 10 ГБ. Я знаю, что мы можем использовать...
Есть ли какие-либо другие возможности для мониторинга и проверки больших заданий distoop, кластера...
Есть ли способ проверить, является ли файл в HDFS доступным для чтения с помощью API FileSystem или...
Есть ли доступ к файлам редактирования для анализа без доступа к суперпользователю hdfs?Кластер, на...
Я только что заметил, что мой Spark на YARN все работает на локальном компьютере, его рабочий...
Мне нужно подключиться к кластеру Hadoop, который имеет аутентификацию Kerberos с использованием...
Я использую Flume для хранения данных датчиков в HDFS.После того, как данные получены через MQTT
Я использую метод import cucumber.api.cli.Main для вызова основного метода огурца, например Main
Для поддержки загрузки больших файлов необходимо указать stream.tmpdir в сценарии оболочки. Но при...
Я понимаю, что по умолчанию куст куста направляет самую правую таблицу в запросе, которую можно...
Я тренируюсь на клоудере ВМ и создал внешний стол.Когда я добавляю раздел, выдается исключение...
Для обработки данных из API я поместил весь набор данных в формате JSONArray в HDFS как:...
Я пытаюсь записать в datalake, используя процессор "PUTHDFS".Я указал путь к файлам core-site.xml и...
Не удалось разместить достаточно реплик: ожидаемый размер равен 1, но можно выбрать только 0 типов...
Мне было интересно, могу ли я записать два отдельных процесса Spark в один каталог HDFS.Будет ли...
Я импортирую 10 записей из СУБД в Hadoop через Sqoop, сбой задания при загрузке седьмой записи...
Я внедряю систему, основанную на Hadoop 3.1.1 и YARN и состоящую из 2 виртуальных машин с...
Когда мы создаем RDD с использованием функции textFile на основе HDFS, он создает разделы в...