Вот случай - у меня большой набор данных, временно сохраненный в AWS SQS (около 200 ГБ). Моя...
Я - Java-разработчик с 5-летним опытом. Теперь я хотел перенести свою карьеру в облачную инженерию...
У меня есть снимок стола Кассандры. Эта новая таблица имеет структуру и данные, отличные от старой,...
Цель, которую я имею, состоит в том, чтобы показывать данные (полученные из CSV-файла) для каждого...
У меня есть ряд вопросов, связанных с sqoop: 1) В чем разница между sqoop --incremental...
У меня есть пара СДР, например: id value id1 set(1232, 3,1,93,35) id2 set(321,42,5,13) id3 set(1233...
Я хочу вычислить скользящее среднее по вектору, при котором окно увеличивается с каждой записью в...
У меня есть сотни файлов по 10 Гбайт каждый. Мне нужно переформатировать файлы и объединить их в...
Я сравниваю Apache Beam SDK с Flink SDK для потоковой обработки, чтобы определить стоимость /...
Как получить корреляцию очень большого набора данных? Я не мог сделать такой подход, https://spark
У меня есть данные некоторых телефонных записей ниже, я хочу удалить первые два значения из каждой...
Контекст В последнее время я работал над итерационным алгоритмом, где каждая итерация n зависит от...
Я не могу подключиться к Cassandra с помощью Talend. У меня есть работа, в которой я пытаюсь...
ОШИБКА yarn.ApplicationMaster: Исключение класса пользователя: java.lang.ClassNotFoundException: не...
Меня попросили настроить эластичный поисковый кластер для примерно 100 ТБ текстовых данных! Я уже...
После долгого поиска правильного способа сохранения DataFrame в Phoenix я заметил, что метод df
Я пытаюсь развернуть простую топологию в Streamline. Получение простой структурированной информации...
У меня проблемы с физической памятью. Когда я добавляю ниже конфиги в рабочий процесс...
Я хочу объединить три таблицы в Spark, используя только внутренние объединения. Я считаю, что могу...
У меня SQL-запрос как таковой: WITH cte AS ( SELECT *, ROW_NUMBER() OVER (PARTITION BY [date] ORDER...
У меня есть каталог в HDFS, каждый обработанный файл помещается в этот каталог с датой...
Для небольшой таблицы (менее 1 миллиона строк и около 1 или 2 ГБ), к которой будет обращаться...
В настоящее время я создаю приложение, в котором я хотел бы отслеживать показы, клики, проданные...
Когда я запускаю искровое задание на кластере пряжи, приложения выполняются в очереди. Итак, как я...
Это один из вариантов использования моего приложения. Я передаю информацию о местоположении (широту...