import findspark findspark.init('C:\spark') from pyspark.sql import SparkSession spark =...
У меня есть следующие 6 Датододов (дн): dn1 - 6 ядер 6 ГБ - 3 слота для карт и 3 слота для...
Чтение файла последовательности с Int и String логически, тогда, если я сделаю это: val...
Я хочу прочитать orders данные и создать из них СДР, который сохраняется как файл sequence в hadoop...
Импорт таблицы с использованием опции lastmodified и --merget-key в команде sqoop в cloudera.это...
Когда я пытаюсь запустить блокнот Jupyter в виртуальной среде, я получаю следующую ошибку -
Я пытаюсь найти количество сотрудников, которым платят меньше, чем средняя заработная плата. Я...
При выполнении задания MR Hadoop делит входные данные на N разделений и затем запускает...
Я, ребята, У меня есть скрипт, который проверяет, доступен ли URL или нет. В скрипте используется...
Я реализую процесс mapreduce, в котором выполняется чтение, обработка и запись в файл orc. Проблема...
Мне нужно сохранить модель XGBoost в hdfs, используя python. Я пытался сделать это, используя xgbm
Как я могу преобразовать дату как '2018-03-31' в bigint в Hive?
Я хочу загрузить несколько файлов в корзину AWS из hadoop. я имею КЛЮЧ ДЛЯ ДОСТУПА AWS, СЕКРЕТНЫЙ...
Я настроил hadoop и запустил его на Docker. Проблема в названии меня сильно смутила. Подробности...
Я пытаюсь получить файлы из hadoop с помощью webhdfs, теперь webhdfs перенаправляет меня на...
Я использую Flume для сбора потоковых данных из Кафки в HDFS. Но источник данных может стать...
giraph использует -vip для пути ввода вершины и -eip для пути ввода ребра. Как мне указать...
Мы работаем над загрузкой полуструктурированного файла XML в таблицах Hive. Это данные о розничных...
Я создал две пустые группы на двух разных узлах моего кластера, по одной на каждом узле. Мой сервис...
Есть много маленьких файлов среди входов в мою задание hadoop (также много других больших файлов)....
Я уже установил требуемое программное обеспечение для всех узлов в соответствии с этим...
есть кое-что, что мне не совсем понятно в функциональном представлении среды программирования...
Здесь https://www.cloudera.com/documentation/enterprise/5-9-x/topics/sentry_intro.html мы можем...
Я пытаюсь найти способ получить следующую информацию, используя Java API HBase (1.2.0-cdh5.8.0) для...
Мы запускаем zeppelin в hdp-песочнице, управляемой с помощью ambari, pyspark, sql и scala работает,...