У меня есть результаты наблюдений радиозондов для более чем 1000 станций в одном файле и список...
У меня проблемы с использованием диска MongoDB. У меня есть приложение и использую один экземпляр...
Я пытаюсь вернуть преобразование из хранилища, в котором оно исчезло. Я работал над преобразованием...
У меня есть четкое представление о том, как Spark разбивает данные на разделы внутри исполнителей,...
Как получить всю запись из n-го сегмента в улье. Выбрать * из bucketTable из сегмента 9;
Я хочу Sqoop данных из базы данных SQL Server в таблицу кустов, и некоторые записи имеют вид 9
У меня есть таблица с 200 миллионами записей. Эта таблица обновляется за минуту и к ней...
Используя python и pandas, как вывести количество ресторанов в каждой категории? У меня есть набор...
Я использовал Tkinter для отображения изображения с URL, но получаю много ошибок, связанных с...
Я пытаюсь объединить два больших набора данных (около 3,5 м строк в каждом), используя...
Мне нужно объединить около 2 миллионов точек данных, фрейм данных состоит из широт, долгот и другой...
Какой тип данных я могу использовать для представления 9.653133E + 08 в Hive? Я использовал...
У меня много данных в формате csv (около 3000 файлов). Я инициализирую свою программу, используя...
Я пытаюсь использовать Hive для MR, выполняющего SQL, и он не работает на полпути с ошибками ниже:...
Как загрузить / прочитать 1 ТБ данных из Oracle в Spark? Есть ли какой-то план, который я могу...
У меня есть огромный файл JSON.gz (gzipped, около 700 ГБ), который разделен. Я применил lapply и...
Я разрабатываю сервисное приложение на основе проекта Hive jdbc-examples, не могу запустить...
Я пытаюсь объединить ~ 50 фреймов данных (10M x 6) с помощью приведенного ниже фрагмента: for i, df...
Какие инструменты для автоматизации регрессионного тестирования в хранилище данных вы используете?...
Я работаю с набором данных 80 Гб в Python. Данные имеют 30 столбцов и ~ 180 000 000 строк. Я...
Я выполняю операцию, которая включает в себя различные операции (вычитание, возведение в квадрат,...
Попытка скопировать данные из нескольких папок hdfs в другую. Исходные пути определены с помощью...
В настоящее время в моей компании каждая команда, которой необходимо предоставлять данные из HDFS...
Я столкнулся с несколькими источниками информации, такими как найденный здесь , который объясняет...
У меня есть 5-ти узловый кластер HDP версии 3.1.1. В этом 2 узла Name и 3 узла данных. Я...