Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Я пытаюсь использовать функцию Spark StringIndexer для столбца, содержащего около 15 000 000...

Interfector / 24 августа 2018
0 голосов
0 ответов

У меня есть таблица в улье, которую я использую для создания фрейма данных.Столбец таблицы:...

Learner / 06 июля 2018
0 голосов
2 ответов

Я импортировал данные из базы данных df = spark.read.format("com.mongodb.spark.sql

Matthew / 06 июля 2018
0 голосов
1 ответ

У меня есть массив вложенных объектов JSON, подобный этому: [ { "a": 1, "n": {}...

makar / 06 июля 2018
0 голосов
2 ответов

У меня есть некоторые данные, которые отслеживают изменения названий компаний с течением времени....

nspoljar / 06 июля 2018
0 голосов
1 ответ

Мне нужно найти сумму значений строк примерно для столбца 900. Я применил функцию по этой ссылке...

Ahmad Suliman / 06 июля 2018
0 голосов
1 ответ

(Apache Spark версии 2.3.1 для блоков данных) Здравствуйте, у меня есть дамп JSON, который выглядит...

Rohan / 06 июля 2018
0 голосов
0 ответов

Я хотел бы создать столбец с последовательными номерами в pyspark данных, начиная с указанного...

max04 / 06 июля 2018
0 голосов
1 ответ

При запуске примера кода Tfidf из документации по spark 2.2.0, вот ссылка: https://spark.apache

Mr.Panchamia / 05 июля 2018
0 голосов
1 ответ

Я не был уверен, что озаглавить этот вопрос - рад за предложенное лучшее резюме Я бьюсь головой,...

Renée / 05 июля 2018
0 голосов
1 ответ

Получение ошибки при вызове кода ниже. Это взрыв массива в кадре данных без потери нулевых значений...

VermaAbhishek / 05 июля 2018
0 голосов
0 ответов

Я пытаюсь подсчитать, сколько раз поле «мера» имеет значение «М» между датой 1 и датой 2 для каждой...

alejandro pareja / 05 июля 2018
0 голосов
0 ответов

У меня есть простой код Pyspark импорт пиарроу fs = pyarrow.hdfs.connect () Если я запускаю это с...

VShankar / 05 июля 2018
0 голосов
1 ответ

Я пытаюсь отправить приложение Python, используя spark-submit, например: spark-submit \ --conf...

Tw UxTLi51Nus / 05 июля 2018
0 голосов
0 ответов

Я создал блокнот в Jupyter SPARK_MAJOR_VERSION=2 PYSPARK_DRIVER_PYTHON=jupyter...

Nikolay Baranenko / 05 июля 2018
0 голосов
1 ответ

Привет! Я только что настроил режим Spark Cluster Mode и пытаюсь запустить оболочку pyspark, но...

Kenza / 05 июля 2018
0 голосов
1 ответ

Пытается прочитать файл Parquet в PySpark, но получает Py4JJavaError. Я даже попытался прочитать...

Shirish Kadam / 05 июля 2018
0 голосов
1 ответ

Я выполняю задание pyspark на кластере ec2 с 4 работниками. я получаю эту ошибку: 2018-07-05...

sparkly / 05 июля 2018
0 голосов
2 ответов

Я пытаюсь получить Pyspark схему из файла JSON, но когда я создаю схему, используя переменную в...

Sumit Gupta / 05 июля 2018
0 голосов
0 ответов

Я пытаюсь запустить код STA / LTA, предназначенный для обнаружения событий при потоковой передаче с...

Zeinab Akhavan / 05 июля 2018
0 голосов
2 ответов

У меня есть кадр данных, содержащий только один столбец с элементами типа MapType(StringType(),...

Parag S. Chandakkar / 05 июля 2018
0 голосов
1 ответ

Я создал DataFrame со своими данными для проведения экспериментов по машинному обучению. Я пытаюсь...

LuizF Gonçalves / 04 июля 2018
0 голосов
1 ответ

Я хочу преобразовать большой фрейм данных Spark в Pandas с более чем 1000000 строками. Я попытался...

Saeid SOHEILY KHAH / 04 июля 2018
0 голосов
1 ответ

Я хочу разделить имя файла на две строки, подскажите, пожалуйста, как его разделить. Например,...

SUNDAR / 04 июля 2018
0 голосов
1 ответ

Я пытаюсь объединить два кадра данных на группу, чтобы заполнить время для каждого пользователя....

Sotos / 04 июля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...