Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

В настоящее время я пытаюсь отсортировать большой объем данных и записать их в линейные объекты...

markvdlaan93 / 19 июня 2019
1 голос
1 ответ

У меня есть следующий фрейм данных: from pyspark.sql import SparkSession sqlContext = SparkSession

giser_yugang / 19 июня 2019
0 голосов
0 ответов

У меня есть список журналов пути навигации по сайту, и я хочу подсчитать, для каждой возможной пары...

arthur / 19 июня 2019
0 голосов
2 ответов

Я использую pyspark версии 2.4, и я пытаюсь написать udf, который должен взять значения столбца id1...

SkyOne / 19 июня 2019
0 голосов
0 ответов

Мы передаем несколько ZIP-файлов на Spark-Submit с параметрами --py-files, пример ниже....

Joby / 19 июня 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я пытаюсь использовать соединитель BigQuery со Spark на моей локальной машине. Но он выдает ошибку...

Vivek / 19 июня 2019
0 голосов
2 ответов

Я хочу рассчитать процент от пропущенного значения pct_<original_name>_valid для каждого из...

neobot / 19 июня 2019
1 голос
1 ответ

При использовании findspark.find () мне дается путь, по которому устанавливается spark, но при...

Jon / 19 июня 2019
0 голосов
0 ответов

Я использую Spark 2.4.3 в локальном режиме и могу загружать файлы, но не могу записать их обратно в...

Zach Binkley / 18 июня 2019
0 голосов
1 ответ

Я пытался использовать .agg(avg("boolean_column")), но получил ошибку: "function...

BirdLaw / 18 июня 2019
0 голосов
0 ответов

Я транслирую твиты из приложения Twitter в Spark для анализа. Я хочу вывести итоговую таблицу Spark...

sebm / 18 июня 2019
0 голосов
1 ответ

Мне нужно переименовать столбцы таблицы () со значениями из таблицы сопоставления (df2 ниже) в...

PeterThePig / 18 июня 2019
0 голосов
0 ответов

Я использую spark.ml для запуска модели линейной регрессии.Но всякий раз, когда я подгоняю свои...

Japneet Singh / 18 июня 2019
0 голосов
0 ответов

Я пытаюсь создать образ докера, используя s2i и Jenkins. У меня есть следующие зависимости в...

H.Z. / 18 июня 2019
0 голосов
0 ответов

Я пытаюсь запустить приложение pyspark в режиме кластера с помощью следующей команды spark-submit...

syv / 18 июня 2019
0 голосов
0 ответов

Я портирую на pyspark алгоритм прогнозирования, разработанный на python.Среди различных этапов...

ndricca / 18 июня 2019
0 голосов
0 ответов

Мой вопрос относится к этому одному , но ответы там у меня не сработали. Я запустил кластер EMS AWS...

Gaurav Bansal / 18 июня 2019
0 голосов
1 ответ

При попытке преобразовать фрейм данных pyspark в фрейм данных pandas, используя функцию стрелки,...

Nikita Rathi / 18 июня 2019
0 голосов
0 ответов

Я надеюсь сгенерировать таблицу с двумя столбцами (sku_id, seo) из Кассандры. Я уже связал...

Ruifeng Wang / 18 июня 2019
0 голосов
0 ответов

У меня есть задание PySpark, которое я отправляю в Livy через HttpClient Livy , и я хотел бы...

Bolchojeet / 18 июня 2019
3 голосов
1 ответ

Мы все знаем, что в SQL, как правило, у нас есть определенный порядок лексических операций при...

Georgi Raychev / 18 июня 2019
0 голосов
0 ответов

Я скачал lpsolve и поместил в соответствующие им каталоги.Я могу запустить из командной строки. Но...

Akalya Raj / 18 июня 2019
0 голосов
2 ответов

Я пытаюсь преобразовать большой файл паркета в CSV. Так как объем моей оперативной памяти...

Rahul / 18 июня 2019
1 голос
2 ответов

У меня есть массив очень большого размера.Я хочу сделать линейную регрессию на каждом столбце...

Fei Yao / 18 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...