Я использую команду WITH table_name AS (select...;) в SQL Developer, чтобы создать временную...
Я пытаюсь экспортировать набор данных avro со столбцами, которые все соответствуют таблице в...
У нас есть запрос, который выполняется для разных источников, много раз каждый день. Каждый раз,...
У меня есть кластер hadoop (hdfs, yarn, hbase), и разработчики жалуются на проблемы с...
У нас есть запрос, который использует регистр в выражении NVL. Однако я думаю, что NVL можно...
Я пытаюсь загрузить файл json с помощью json serde.Я успешно добавил файл serde jar. 1) Мой...
Я пишу скрипт Python, работающий на моем компьютере для тестирования, когда я устанавливаю его в...
допустим, у меня есть таблица улья, в которой есть только один столбец типа array<int>. Я...
Я пытаюсь установить Hadoop 3.2.0 на Windows 10, используя в основном следующий учебник:...
Привет всем, что я пытаюсь использовать Maximinds GeoIP2 города и страны поиска. Я провел часы и...
Я работаю над практическими вопросами о cca-175.Мне дают текстовый файл, который разделен на |:...
Я пытаюсь экспортировать данные из таблицы Impala в таблицу Oracle с помощью экспорта Sqoop, но я...
Я пытаюсь загрузить файл json в hadoop с помощью json serde. Я загрузил jar lib в hadoop, но...
Я пытаюсь настроить задание MapReduce на uber mode, но консоль по-прежнему выходит из системы uber...
Почему HDFS использует буфер протокола вместо API сериализации Java? Что делать, если я хочу...
Ничего страшного, что я загружаю файл в HDFS с помощью оболочки на удаленном сервере, но когда я...
Я запускаю команду hdfs fsck / в своем кластере из 1 главного узла и 7 узлов данных, но я получаю...
Я хочу использовать MapReduce, чтобы получить максимальное значение и минимальное значение для...
Мне нужно вставить несколько CSV-файлов, основанных на именах таблиц, в соответствующие таблицы...
Я использую ConfigParser для чтения значений ключей, которые передаются моей программе pyspark. Код...
Ниже приведен мой поток: GetFile > ExecuteSparkInteractive > PutFile Я хочу прочитать файлы с...
Я пытался установить Hadoop на macOS.Я могу запустить hdfs через ./start-dfs.sh, но ./start-yarn.sh...
В настоящее время я работаю над распределенной файловой системой Hadoop (HDFS).Я должен изменить...
Как spark определяет, сколько раз реплицировать кэшированный раздел? Уровень хранилища на вкладке...
Можно ли изменить каталог _temporary, в котором spark сохраняет свои временные файлы перед записью?...