Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

Я хочу прочитать некоторые файлы схемы json из AWS S3 и преобразовать их в Spark StructType. У...

Pedro Kássio / 08 октября 2019
0 голосов
0 ответов

Могу ли я оценить искру в наборе инструментов Scala? Мне нужно что-то прочитать с помощью spark на...

afghifari / 08 октября 2019
0 голосов
0 ответов

При чтении в огромном текстовом файле с разделителями я хотел бы выдать ошибку, если какая-либо из...

Andrew / 08 октября 2019
0 голосов
0 ответов

Я следовал инструкциям по установке pyspark на окнах, как https://datainsights

Chris hum / 08 октября 2019
0 голосов
1 ответ

Сначала я хотел бы заявить, что я не могу использовать панд. То, что я пытаюсь сделать, это...

wookieluvr13 / 08 октября 2019
0 голосов
1 ответ

У меня был Dockerfile следующим образом FROM python:3.7 RUN apt-get update RUN apt-get install...

EuRBamarth / 08 октября 2019
0 голосов
0 ответов

Я пытаюсь тренироваться на наборе данных, но независимо от того, какой столбец я выбираю (или даже...

wookieluvr13 / 08 октября 2019
0 голосов
0 ответов

У меня есть UDF, который пользователи Counter используют для поиска n наиболее часто встречающихся...

Absurdist_VT / 08 октября 2019
1 голос
0 ответов

Я получаю NoClassDefFoundError на JavaBytesEncoder из задания Spark, которое просто считывает...

sfbay / 08 октября 2019
1 голос
2 ответов

У меня есть искровой фрейм данных с 3 столбцами, хранящими 3 разных прогноза. Я хочу знать...

NITS / 07 октября 2019
0 голосов
1 ответ

У меня два записанных потока Spark в записной книжке для параллельной работы. spark.sparkContext

Josh / 07 октября 2019
0 голосов
0 ответов

Вдохновленный отсутствием (Py) Spark, эквивалентного этому вопросу , мне интересно, как Spark...

brme / 07 октября 2019
0 голосов
1 ответ

Используя Spark 2.2 со спарк-оболочкой, попробуйте toDF и toDS. case class Person(name: String,...

Peter Krauss / 07 октября 2019
5 голосов
1 ответ

Недавно я начал получать кучу ошибок на ряде pyspark заданий, работающих в кластерах EMR. Ошибки...

ilijaluve / 07 октября 2019
0 голосов
0 ответов

У меня есть требование, чтобы почти 250 ГБ входного zip-файла из SFTP сохранялись в HDFS с...

Naveen / 07 октября 2019
1 голос
0 ответов

Я настроил SparkSession для установки размера полосы файла ORC равным 128 МБ, но фрейм данных spark...

Saiteja Desu / 07 октября 2019
1 голос
2 ответов

У меня есть фрейм данных с 3 следующими столбцами student_id name timestamp Есть несколько строк...

newbie / 07 октября 2019
0 голосов
0 ответов

Я скачал Spark вручную и разархивировал файл .tgz. Как мне сообщить sparklyr, где найти мою...

xiaodai / 07 октября 2019
0 голосов
1 ответ

Я пытаюсь применить LinearRegression на созданных бинах настроек. DataFrame, который содержит...

wookieluvr13 / 07 октября 2019
0 голосов
1 ответ

Я пишу приложение Spark, работающее на HDFS, выводом является RDD, который я должен сохранить в...

Techteenhere / 06 октября 2019
0 голосов
2 ответов

Например, у меня есть только 1 исполнитель с памятью 4G, и 100 разделов partitons.each нужно...

jon / 06 октября 2019
1 голос
1 ответ

Облако сообщества Databricks выдает исключение org.apache.spark.SparkException: Task not...

mrn / 06 октября 2019
1 голос
2 ответов

У меня есть фрейм данных, содержащий следующие 2 столбца, среди прочих: 1. ID 2. list_IDs Я пытаюсь...

Absurdist_VT / 06 октября 2019
0 голосов
1 ответ

У меня есть фрейм данных df1: +-------------------+-----+ | start_date |value|...

sr9419 / 05 октября 2019
0 голосов
1 ответ

У меня проблема с использованием библиотеки rocksDb в scala. Я пытаюсь импортировать org.rocksdb

Razor21 / 05 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...