Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
2 ответов

Я начинаю с PySpark, строю бинарные классификационные модели (логистическая регрессия), и мне нужно...

Barranka / 29 января 2019
0 голосов
1 ответ

Совершенно новый для Pyspark, и я реорганизую некоторый код R, который начинает терять свою...

DataDog / 29 января 2019
0 голосов
1 ответ

У меня около 70 запросов к ульям, которые я последовательно выполняю в pyspark.Я ищу способы...

Ananth Gopinath / 29 января 2019
0 голосов
1 ответ

У меня есть файл JSON, который я сохранил в BLOB-объекте.Я хочу прочитать этот файл как словарь.Для...

Visualisation App / 29 января 2019
0 голосов
1 ответ

Я установил pyspark в среде миниконды на Ubuntu через conda install pyspark.Пока все работает...

oulenz / 29 января 2019
0 голосов
1 ответ

У меня есть следующая задача: загрузка данных из одной таблицы из нескольких схем использование...

Juraj / 29 января 2019
0 голосов
1 ответ

Я думаю, что AWS Glue не хватает памяти после сбоя записи выходных данных паркета ... Произошла...

Jiew Meng / 29 января 2019
0 голосов
0 ответов

Я использую новую функцию pyspark arrays_zip в v2.4, чтобы сжать следующие массивы:...

Aydus-Matthew / 29 января 2019
0 голосов
1 ответ

У меня есть класс Age, файл csv и сеанс времени выполнения pyspark ages.csv Name;Age...

ttbsttsoo / 29 января 2019
0 голосов
1 ответ

У меня есть следующий пример данных.Столбцы date_1 и date_2 имеют тип данных отметки времени. ID...

PineNuts0 / 29 января 2019
0 голосов
1 ответ

Случай 1: Когда я пытаюсь получить «b.no» с сообщением об ошибке, ниже сообщается код, а также...

RK. / 28 января 2019
0 голосов
1 ответ

Я использую эту формулу, взятую из другого поста SO, для вычисления средних значений столбцов в...

Francesco Boi / 28 января 2019
0 голосов
1 ответ

Я пытаюсь изменить все столбцы искрового фрейма данных на двойной тип, но я хочу знать, есть ли...

GDK / 28 января 2019
0 голосов
0 ответов

Я использую pyspark 2.3 на ноутбуке Jupyter на ПК Lenovo (Windows 10 и Ram 48 G), я пытался...

Sidhom / 28 января 2019
0 голосов
1 ответ

Я бы хотел выполнить SparkSQL на SageMaker с помощью AWS Glue, но пока не получилось. Я хочу...

tsuda7 / 28 января 2019
0 голосов
0 ответов

Мне интересно, почему мое задание Glue выполняется так медленно, даже если у запроса есть...

Jiew Meng / 28 января 2019
0 голосов
1 ответ

Я использую как hdfs, так и обычный пользовательский режим. По умолчанию локальная версия Python -...

Shilpa / 28 января 2019
0 голосов
1 ответ

Я хочу использовать предварительно встроенную модель встраивания (fasttext) в приложении pyspark....

bib / 28 января 2019
0 голосов
0 ответов

Я пытаюсь найти соседние вершины конкретной вершины, используя API графического фрейма, доступный в...

Redwan Khan / 27 января 2019
0 голосов
0 ответов

Итак, вот мой искровой код на python, который я выполняю с запущенным в фоновом режиме hadoop: from...

Pedro González / 27 января 2019
0 голосов
1 ответ

Как мне отсортировать идентификаторы как A1, A2, A10, B1 и т. Д. В pyspark? Я хотел бы иметь...

Kasaram Bala / 27 января 2019
0 голосов
2 ответов

У меня df вот так, +----+---+ | _c0|_c1| +----+---+ |('a'| 2)| |('b'| 4)|...

Pradeep Sonaimuthu / 27 января 2019
0 голосов
0 ответов

Я пытаюсь проанализировать дампы истории Википедии из XML в PySpark Dataframe. Когда я анализирую...

Благојче Митревски / 26 января 2019
0 голосов
1 ответ

Я пытаюсь преобразовать строковые столбцы в числовые, но получаю исключение в PySpark.Ниже приведен...

user8270077 / 26 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...