У меня есть небольшой файл JAR, который является правильным, потому что я проверил его на другом...
У меня есть набор данных, который структурирован следующим образом: [uid, product, currency,...
почему «set» имеет только один элемент, в то время как, например, он должен иметь 4 элемента для...
Я пытаюсь сохранить данные в текстовом файле из кода ниже и сохранить его в корзину S3. После...
Я скачал дистрибутив spark 2.4.2 и поместил его в C: \ Program Files (x86). Я также установил...
Я читаю файл в искровом фрейме.В первом столбце я получу два значения, соединенных с "_".Мне нужно...
Я пишу небольшую программу для загрузки файлов hdfs с использованием Java. Когда я запускаю код, я...
Мне нужно прочитать файл с двумя полями FromNode и ToNode, разделенными табуляцией в Giraph.По сути...
у нас есть кластер hadoop, который содержит все соответствующие компоненты / сервисы как HDFS YARN...
Как сделать так, чтобы соединитель Flink HCFS читался из Google Cloud Storage с шаблоном, подобным...
После запуска TestDFSIO я получил следующие метрики: 2019-04-30 09:50:35,790 INFO fs.TestDFSIO:...
Мы используем Amazon EMR release 5.21.0, который должен включать следующие компоненты: Hadoop 2.8.5...
Я пытаюсь доказать, что система больших данных, такая как Apache Hadoop или Google BigQuery, могла...
Я выполнил установку Hadoop в Windows. При выполнении команды (hdfs namenode –format) выдается...
У меня есть три физических узла с установленным докером на каждом из них. Я настроил Mesos,...
Мы устанавливаем новые каталоги кода уровня проекта, в которых будут размещаться скрипты PySpark,...
Я пытаюсь работать со следующим набором данных на свинье https://www.kaggle
Я выполняю Spark Application в Hue Workflow (Oozie). (AWS EMR) Hadoop EMR 2.7.3 Hive 2.3.0 Hue 3.12
Запуск на Hadoop 2.7.5 и запуск простого скрипта Pig (0.17.0). После успешного завершения работы я...
1) создать одну фиктивную таблицу с одним столбцом 2) загрузить данные из главной таблицы в...
Как получить показатели производительности для приложений mapreduce, которые я запускаю в командной...
Мне нужно импортировать данные с нескольких разных серверов SQL, которые имеют одинаковые таблицы,...
Я пытаюсь установить oozie 4.1.3 на сервер RHEL.После настройки, когда я пытаюсь запустить службу...
Я создал автономный кластер hadoop, используя этот учебник.Затем я установил HBase поверх hadoop,...
Я пытаюсь выполнить программу на python, передав аргументы через файл CSV в оболочке (hortonworks)...