Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
2 ответов

искра ленивая, верно?так что же делает load()? start = timeit.default_timer() df = sqlContext.read

eugene / 29 июня 2019
0 голосов
1 ответ

Я работаю над сценарием, чтобы читать данные из mongodb, анализировать данные в spark и записывать...

Kemparaju / 29 июня 2019
0 голосов
0 ответов

Данные - это набор кортежей в формате: (группа, номер) data.map(a => (a._1, (a._2, 1)))

dafie / 29 июня 2019
1 голос
1 ответ

Я пытаюсь добавить новый столбец в каждую строку DataFrame, как это def addNamespace(iter:...

KingJames / 28 июня 2019
0 голосов
0 ответов

Я пытаюсь получить имя входного файла (или путь) для каждого файла, загруженного через каталог...

Will Croft / 28 июня 2019
0 голосов
0 ответов

Я пытаюсь загрузить CSV-файлы из HDFS в информационный кадр, но получаю странную ошибку, как...

Amaan Khan / 28 июня 2019
0 голосов
0 ответов

Я хочу использовать Snowflake Spark Connector для экспорта данных из экземпляра Snowflake клиента....

Codious-JR / 28 июня 2019
0 голосов
0 ответов

Я пытаюсь запросить таблицу улья из spark в HDP Я следую инструкциям здесь: https://docs

dhalfageme / 28 июня 2019
0 голосов
1 ответ

У меня есть RDD [некоторый класс дел], и я хочу преобразовать его в CSV-файл.Я использую spark 1.6...

siddhau jain / 28 июня 2019
0 голосов
1 ответ

У меня есть массив как Array[(Any, Any, Any)]. Например: l1 = [(a,b,c),(d,e,f),(x,y,z)] Я хочу...

Gaurav Kumar / 28 июня 2019
0 голосов
0 ответов

Я новый пользователь Pyspark.У меня есть опыт работы с реляционными базами данных (sql).Я хотел...

Ankan / 27 июня 2019
2 голосов
1 ответ

Я хотел знать, есть ли какой-нибудь способ использовать информацию метаданных, уже присутствующую в...

Sai Kiran KrishnaMurthy / 27 июня 2019
0 голосов
1 ответ

У меня Mac, и у меня есть несколько запросов sql spark, которые мне нужно выполнить для данных улья...

Hunter Mitchell / 27 июня 2019
1 голос
1 ответ

Я пытаюсь обучить ANN для классификации текста: mlp = MultilayerPerceptronClassifier(maxIter=10,...

Simone / 27 июня 2019
1 голос
2 ответов

Вариант использования - чтение файла и создание над ним фрейма данных. После этого получите схему...

pratik rudra / 27 июня 2019
0 голосов
0 ответов

Я пытаюсь создать для моего кода udf для обобщения проблемы.У меня возникают проблемы, когда...

Rob / 27 июня 2019
0 голосов
1 ответ

Я новичок в программировании, и я очищаю и упрощаю свой код для выполнения групповой работы и...

Rob / 27 июня 2019
0 голосов
1 ответ

Попытка собрать Spark 2.4.3 из источника с текущим Hadoop 3.1.2 (в CentOS 7.5):

kermatt / 27 июня 2019
1 голос
1 ответ

Я пытаюсь запустить мое искровое приложение в локальном режиме из Intellij. Приложение читает...

Abdul Rahman / 27 июня 2019
0 голосов
1 ответ

У меня есть сценарий pyspark в записной книжке Zeppelin, который я указываю на файл JSON,...

Nibroc A Rehpotsirhc / 27 июня 2019
1 голос
1 ответ

Короче У меня есть декартово произведение (кросс-соединение) двух фреймов данных и функция, которая...

Rodion Gorkovenko / 27 июня 2019
0 голосов
0 ответов

У меня есть исключение: java.lang.NoClassDefFoundError: org / datasyslab / geospark / serde /...

Loom / 27 июня 2019
0 голосов
0 ответов

Я хочу понять, как получить функцию Instance для набора данных. у меня есть некоторый набор данных,...

Praveen Saini / 27 июня 2019
0 голосов
0 ответов

Я вижу следующие типы сообщений при кэшировании больших фреймов данных в pyspark с помощью YARN: -...

DinoG / 27 июня 2019
0 голосов
1 ответ

У меня есть файл расширения .dat, который не имеет заголовка 1. поля, разделенные '\ u0001' 2....

Preethi / 27 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...