Надеемся, что это упражнение будет полезно для тех, кто плохо знаком с hadoop и spark. Это более...
Я запускаю сеанс livy из записной книжки Zeppelin и запускаю простой код, чтобы найти версию python
У меня есть пара простых программ сокращения карт, которые я написал, и та, которую я написал с...
Когда я вставляю данные в таблицу из файла, одним из атрибутов которого была дата, появляется...
Когда я запускаю serverHive2 в cmd ubunto, у меня есть: /local/hive/lib/hive-jdbc-2.1.0-standalone
Я пытаюсь добавить новый собственный кодировщик raw в hadoop-3.0.3, но столкнулся с ошибкой...
У меня есть задание scala, которое запрашивает таблицы Hive через spark sql, а затем выполняет...
Я использую следующее: библиотека pyspark, версия 2.3.1 python, версия 2.7.1 hadoop, версия 2.7.3...
Согласно презентации «Получение журналов и метрик в метрическом магазине» здесь слайд 23 - GDI:...
У меня есть таблица, которая составляет 61 ГБ и пытается импортировать импорт.Если имеется 50...
В моем искровом коде я записываю свой фрейм данных в виде файла паркета на hdfs.Затем я создал...
ENV: ambari 2.7 HDP 3.1.0 enbaled kerberos использование openldap В кластере используется kerberos....
Моя конечная цель - замаскировать данные в одном конкретном файле. Я хочу переместить файлы из...
Я хочу запустить скрипт оболочки с локального пути (Edge node) вместо каталога hdfs через oozie....
Мне нужно обновить каждый элемент, чтобы добавить атрибут в таблицу DynamoDB.Таблица содержит...
Я следовал поваренной книге Hadoop MapReduce , чтобы создать наивную байесовскую классификационную...
Я использую приемник Flink от Kafka до HDFS.Версия Flink - 1.4.2. Я обнаружил, что при каждом...
Я загружаю CSV-файл в таблицу через внешнюю таблицу в кусте. CSV имеет 1000 строк. Но когда я...
Я пытаюсь переместить рабочие процессы oozie, принадлежащие бывшему члену команды, в общую учетную...
Я новичок в больших данных.Я пытаюсь внедрить коллекцию MongoDB в hdfs, и у меня есть выбор...
Если я запускаю следующее в spark 1.6, оно работает нормально, но в spark 2.2 я получаю следующую...
Я пытаюсь преобразовать pdf файлы в изображение, а затем использовать pytesseract для записи файлов
Я пытаюсь перезаписать существующую таблицу, используя sqoop import без условий.Ниже приведена...
Ежедневно мне нужно обобщать действия клиентов для разных вариантов использования. Чтобы сохранить...
Я новичок в HBase, у меня есть главная таблица с rowkey = id-YYYYMMDD и вторичная индексная таблица...