Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

1 голос
1 ответ

Я пробую Спарк на Кубернетесе. Только что скачал Spark 2.4.3 на экземпляре EC2 в моем VPC. Я...

Venkat Ankam / 05 июня 2019
2 голосов
0 ответов

Я пытаюсь создать фрейм данных из файлов json, содержащих месячные сетевые сообщения и получающих...

kupe / 05 июня 2019
0 голосов
1 ответ

У меня огромный набор данных с грязной структурированной схемой. Скажем, одни и те же поля данных...

Louis Luk / 05 июня 2019
0 голосов
1 ответ

Я пытаюсь написать вспомогательную функцию, которая получает набор данных любого типа Dataset[_] и...

HayreddinLuo / 05 июня 2019
0 голосов
2 ответов

Я немного новичок в разборе pyspark и json и застрял в каком-то определенном сценарии. Позвольте...

Radman Shiekh / 04 июня 2019
0 голосов
1 ответ

Я пытаюсь прочитать несколько файлов Excel, которые находятся в одном каталоге, но я столкнулся с...

HadoopD / 04 июня 2019
1 голос
1 ответ

Я хочу обработать ~ 500 ГБ данных , распределенных по 64 файлам JSON каждый, содержащий 5M записей

ramd / 04 июня 2019
1 голос
1 ответ

У меня есть датафрейм, в котором есть несколько столбцов с данными даты. Я хочу применить проверку...

Praveen / 04 июня 2019
0 голосов
0 ответов

Я хотел бы сначала извиниться, если это не правильный способ задать вопрос, но это мой первый. У...

OGC / 04 июня 2019
3 голосов
1 ответ

Я пишу приложение для предварительной обработки, которое, помимо других преобразований и действий,...

magnus / 04 июня 2019
0 голосов
0 ответов

Я новичок в Hive и хотел понять, что не так с этим запросом? df_tickets = hiveContext

Alan / 03 июня 2019
0 голосов
0 ответов

Я пытаюсь запустить spark-submit для запуска задач pyspark с использованием пользовательских...

Daniel Argüelles / 03 июня 2019
1 голос
0 ответов

Scala API говорит, что register (..) принимает returnType. Но когда я делаю и компилирую, я получаю...

Kyunam / 03 июня 2019
0 голосов
1 ответ

У меня есть датафрейм. Я хочу проверить условие между столбцами: +---+----+------+---------+------+...

Cool Triks / 03 июня 2019
1 голос
1 ответ

Я пытаюсь выполнить команду HDFS изнутри скрипта scala, выполняемого Spark в режиме кластера.Ниже...

knowone / 03 июня 2019
0 голосов
1 ответ
2 голосов
1 ответ

Мой код читает данные из sqlcontext.Таблица содержит 20 миллионов записей.Я хочу рассчитать...

Salma z / 03 июня 2019
0 голосов
1 ответ

Мне нужно записать данные из фрейма данных Spark в HDFS в формате Avro. Проблема заключается в том,...

Cassie / 02 июня 2019
0 голосов
1 ответ

Я новичок в BigData, я пытался вызвать спарк с Apache Livy. С командной строкой submit работает...

EL missaoui habib / 02 июня 2019
0 голосов
2 ответов

У меня есть СДР, и я хочу найти различные значения для нескольких столбцов. Пример: Row(col1=a,...

AlexV / 02 июня 2019
0 голосов
1 ответ

У меня есть следующий входной файл, в котором могут быть плохие записи, я хочу создать исключение и...

Manoj Dhake / 02 июня 2019
0 голосов
1 ответ

Я вижу код из книги "Spark The Definition Guide", он вызывает падение на информационном фрейме без...

eascape / 01 июня 2019
1 голос
0 ответов

Я включаю Hive on Spark согласно документации Cloudera 1 и 2 . Теперь я обнаружил, что число...

iamabug / 01 июня 2019
0 голосов
0 ответов

Код всегда работал в ожидании, пока вчера диск кластера не сломался. Команда поддержки ИТ исправила...

Yanan Chen / 01 июня 2019
0 голосов
1 ответ

У меня есть закодированный фрейм данных, и мне удалось расшифровать его, используя следующий код в...

androboy / 31 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...