Я изучаю основы больших данных для своей диссертации.Я сделал сканер, который загружает данные об...
Я создаю устройство IoT, которое будет производить 200 КБ данных в секунду, и мне нужно сохранить...
Предположим, у меня есть файл Avro, и я хотел бы знать, как добавить новое поле / столбец, например...
Я хочу присоединиться к 3 tables, используя spark rdd.Я достиг своей цели, используя spark sql, но...
Теперь я управляю небольшим кластером hbase, состоящим из примерно десяти серверов регионов, на...
При выполнении большого количества операций MapReduce мне бы хотелось, чтобы передаваемые данные...
я обнаружил, что pubnub - это решение для потоковой передачи реального времени данных в mapbox на...
Я хочу добавить комментарий к каждому столбцу в таблице Hive Parquet.Я пытаюсь добавить комментарий...
Я строю кластер с использованием CDH5.14.2, включает в себя 5 узлов, каждый узел имеет 130G памяти...
Я недавно начал работать над новым проектом, в котором мы используем Spark для записи / чтения...
Наша настройка Google Analytics выглядит следующим образом: настройка cloudera присутствует на...
Привет всем, я пытаюсь загрузить и запустить данные 5000m в ycsb, но у меня есть проблема,...
Перед запуском Pig в режиме уменьшения карты вы всегда должны запустить сервер истории, в то время...
Я получаю одно и то же текстовое значение в столбце A в 2 разных строках.Как и в Excel, мне нужно...
Я анализирую файл журнала для анализа воздействия на клиента с помощью Apache spark.У меня есть...
У меня есть потоковое приложение Spark, которое в основном получает триггерное сообщение от Kafka,...
Как я могу вычислить альфа Кронбаха (например, psych::alpha()) по большой матрице без проблем с...
Часовой пояс по умолчанию - UTC в Фениксе, я хочу установить его на GMT + 8 (часовой пояс Китая) В...
Я использую Flume для хранения данных датчиков в HDFS.После того, как данные получены через MQTT
В подчиненном узле это журнал ошибок агента [16/Oct/2018 06:52:50 +0000] 2154 Thread-13 downloader...
У меня отсутствует зависимость от этого фрагмента: from pyspark import SparkContext from pyspark...
Я пытаюсь загрузить csv на сервер h20 с клиента, работающего под управлением R R с RStudio.Вот как...
Я работаю над настольным приложением, которое очень похоже на WinDirStat или voidtools 'Everything...
Мы выполняем задание в школе с «Большими данными», и многие из нас нашли данные о местах, где мы...
Я хотел бы знать, существуют ли на рынке какие-либо технологии или методы для обработки наборов...