У меня очень большое количество файлов небольшого размера, которые могут быть структурированными...
Я новичок в Big Data, пытаясь понять различные форматы файлов с точки зрения лучшего выполнения...
У меня есть файл XDF (nyc_xdf_lab).В файле у меня есть целочисленный столбец с именем «RatecodeID»...
Я получаю ошибку импорта, когда отправляю рабочий процесс с Hue, который содержит Spark-Action....
Пример: Вместо hive --hiveconf table = employee --hiveconf year = 2019 -f sample.hql Можно ли...
Я работаю с очень большими файлами (например, 1 ГБ +) и хочу прочитать строковую переменную из CSV,...
Я написал функцию, которая ищет в базе данных после фразы.Сначала я ищу записи, в которых есть все...
В одном из моих вариантов использования мне необходимо в потоковом режиме вводить данные из...
У меня есть приложение для управления отелем с модулем бронирования.Я хотел бы иметь возможность...
У меня возникли проблемы с заданием Spark, которое примерно в половине случаев выберет обработку...
Используя Kafka Streams, мы не смогли определить конфигурацию, необходимую для сжатия сообщений,...
В настоящее время я анализирую базу данных электростанции, предоставленную Github .Конечной целью...
Как известно, при подаче заявки можно увеличить количество ядер.На самом деле, я пытаюсь выделить...
Я строю интерактивный график в React, где пользователь может выбрать несколько переменных и...
В рамках проекта я собирал данные от нескольких датчиков, установленных на местах. Цель этого...
Использование Flink 1.7.1 при построении его для кластера с одним заданием на kubernetes flink не...
введите описание изображения здесь У меня проблема с данными транзакций в отчетах о проданных...
У меня есть 25 000 000 кодов (каждый код имеет 8 случайных литералов) для вставки в мою базу данных
Я пытаюсь реализовать алгоритм кластеризации в map-lower для коллекции в mongoDB.Каждый документ...
Кто-нибудь знает, где я могу найти коллекцию примеров файлов для проекта? Например, если я хочу...
Я использую Ubuntu 14, HDP -2.6.5.0-292, версию Ambari 2.7.3 с использованием https://github
Я хочу предоставить данные зависимость входного файла в моем рабочем процессе oozie. Во входном...
Я сталкивался с одним сценарием, когда кто-то по ошибке удалял / удалял таблицу кустов из...
Я создаю exe-приложение с графическим интерфейсом, которое может отображать большие данные около...
Я просто изучаю Python, и, как все знают, лучший способ - это практика;) И теперь у меня есть...