Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Когда я читаю файл CSV с помощью spark-csv, inferschema=true, я могу получить счетчик данных в...

A srinivas / 03 июля 2018
0 голосов
1 ответ

Я пытаюсь разделить фрейм данных в соответствии со значениями одного (или более) столбца и вращать...

d_c / 03 июля 2018
0 голосов
1 ответ

Без обсуждения всех других факторов производительности, дискового пространства и объектов узла Name...

54l3d / 03 июля 2018
0 голосов
1 ответ

Я новичок в SparkR и пробую первые шаги подготовки данных. Набор данных является чем-то в этом роде

Raj Swarnim / 03 июля 2018
0 голосов
1 ответ

У нас есть несколько папок, каждая из которых содержит много файлов CSV. Имя для каждой папки...

milad ahmadi / 03 июля 2018
0 голосов
0 ответов

У меня есть датафрейм, как показано ниже +--------+-----+-------+-------------+----+ |...

Venkat J / 03 июля 2018
0 голосов
1 ответ

У меня есть фрейм данных, и я могу выполнить агрегирование со статическими именами столбцов, т. Е....

Spark Scala Developer / 03 июля 2018
0 голосов
1 ответ

когда я читаю из MySql базы данных, Map<String,String> jdbcOptions = new HashMap<String...

YohanT / 03 июля 2018
0 голосов
1 ответ

Я не могу найти решение для чтения файла CSV, в котором имя столбца повторяется дважды, но при...

serverliving.com / 03 июля 2018
0 голосов
2 ответов

Я пытаюсь прочитать таблицу Hive в Spark. Ниже приведен формат таблицы Улей: # Storage Information...

Subhasis / 03 июля 2018
0 голосов
0 ответов

Запустил задание spark (v2.1.1), которое объединяет 2-е число (одно - файл .txt из S3, другое -...

tooptoop4 / 03 июля 2018
0 голосов
0 ответов

Я работаю с pyspark с версией spark 2.3.1. Я только что установил его и попробовал поиграть с ним...

legoat / 03 июля 2018
0 голосов
1 ответ

У меня есть проект, в котором мне нужно настроить spark и hbase в локальной среде. Я скачал spark-2

Jeevan / 03 июля 2018
0 голосов
2 ответов

У меня есть фрейм данных Spark (scala), в котором некоторые столбцы данных являются необязательными...

B. Smith / 03 июля 2018
0 голосов
0 ответов

Мне нужно прочитать данные из базы данных Oracle, используя JDBC с Spark (2.2). Чтобы свести к...

Hanebambel / 02 июля 2018
0 голосов
0 ответов

Я пытаюсь присоединить таблицу к себе. Я получаю строки таблицы, затем по второму запросу снова...

H. Trujillo / 02 июля 2018
0 голосов
1 ответ

У меня есть этот код, и он выдает ошибку, basepath должен быть dir. Просто хочу запустить простую...

Sam / 02 июля 2018
0 голосов
1 ответ

Рассмотрим следующий фрейм данных: #+------+---+ #|letter|rpt| #+------+---+ #| X| 3| #| Y| 1| #|...

pault / 02 июля 2018
0 голосов
1 ответ

у меня струится искра (2.1.1 с cloudera 5.12). с входной кафкой и выходной HDFS (в формате паркета)...

Yassine Jouini / 02 июля 2018
0 голосов
1 ответ

Я пытался использовать UDF в spark и заметил, что существует три различных способа объявления UDF,...

Masterbuilder / 02 июля 2018
0 голосов
1 ответ

У меня есть набор данных Spark dataset. Мне нужно сделать .collectAsList() для каждого столбца...

Garry Steve / 02 июля 2018
0 голосов
1 ответ

Внешняя таблица Hive указывает на файлы на S3, ddl включает разделы по выражению eod. Под папкой...

tooptoop4 / 02 июля 2018
0 голосов
1 ответ

Кажется, одно из моих предположений было неверным в отношении порядка в СДР ( относящегося )....

icarus / 02 июля 2018
0 голосов
1 ответ

У меня есть большой файл, хранящийся в HDFS, где в последнем столбце у меня есть машинный адрес, я...

Houssam Eddine Swd / 02 июля 2018
0 голосов
1 ответ
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...