Вопросы с тегом апач искровые pyspark - PullRequest

Вопросы с тегом апач искровые pyspark

0 голосов
0 ответов

У меня есть скрипт на python, который использует spark для преобразования файлов в паркет, а затем...

Mark Goodwin / 18 января 2019
0 голосов
1 ответ

Я только начинаю работать с AWS и играю с EMR и CloudFormation. Моя цель - написать шаблон...

activelearner / 12 января 2019
0 голосов
0 ответов

Я установил Anaconda3, версию Hadoop hadoop-2.7.7 и версию spark spark-2.4.0-bin-hadoop2.7, успешно

Green / 10 января 2019
0 голосов
1 ответ

Исключение: Python в рабочей версии отличается от версии 2.7, чем в драйвере 3.5, PySpark не может...

Vijay Bhargav / 09 января 2019
0 голосов
1 ответ
0 голосов
1 ответ

Есть ли API-интерфейсы для создания в стеке ансамблей стека или нужно создавать их с нуля? Я не...

Odisseo / 05 января 2019
0 голосов
2 ответов
0 голосов
0 ответов

Я пытаюсь вставить значения в уже существующую таблицу кустов. Значения вставляются в таблицу...

marjun / 27 декабря 2018
0 голосов
1 ответ

На разумно оборудованном 64-битном сервере Fedora (домашний) с 12-Cores и 64gb-RAM у меня Spark 2.4...

NYCeyes / 21 декабря 2018
0 голосов
1 ответ

Я запускаю блокнот pyspark jupyter со скриптом: #!/bin/bash ipaddres=... echo "Start notebook...

Sören / 13 декабря 2018
0 голосов
0 ответов

У меня есть модель, подогнанная DecisionTreeClassifier (класс DecisionTreeClassificationModel ), и...

mrjoseph / 12 декабря 2018
0 голосов
0 ответов

Я использую логистическую регрессию в pyspark, используя версию spark: 2.1.2 Я знаю, что можно...

hamiq / 11 декабря 2018
0 голосов
1 ответ

я использую python 2 и spark.Я следую инструкции по подсчету слов в твиттере по этой ссылке...

dinhvan2804 / 08 декабря 2018
0 голосов
1 ответ

Я пытаюсь заставить некоторые академические POC работать с pyspark с помощью com.databricks:...

Przemysław Puchajda / 30 ноября 2018
0 голосов
0 ответов

Я пытаюсь протестировать некоторые функции, реализованные с помощью Spark Data-frames.Для...

Vzzarr / 29 ноября 2018
0 голосов
0 ответов

Я реализовал распределенную версию K-режимов с использованием pyspark со страницы GitHub...

Meng Di / 26 ноября 2018
0 голосов
1 ответ

Для задания, выполняемого на данных из корзины S3 в формате паркета, существует два способа:...

Sinan Erdem / 22 ноября 2018
0 голосов
0 ответов

Я пытаюсь записать фрейм данных в базу данных OmniSci, в основном это база данных SQL с...

DataScienceAmateur / 21 ноября 2018
0 голосов
1 ответ

Я хотел бы использовать пакет GrameFrames, если бы я запускал pyspark локально, я бы использовал...

foobar / 19 ноября 2018
0 голосов
1 ответ

У меня есть несколько pyspark ноутбуков с ядром jupyter, которые работали месяцами, но в последнее...

javadba / 18 ноября 2018
0 голосов
1 ответ

У меня есть несколько заданий PySpark на EMR, и я хотел бы создать их как веб-сервис.Любое...

RK. / 16 ноября 2018
0 голосов
0 ответов

Я пытаюсь включить шаг EMR, который является любой задачей Pyspark, в мой скрипт оболочки следующим...

AKSHAY SHINGOTE / 16 ноября 2018
0 голосов
2 ответов

У меня проблемы с загрузкой большого файла из моего озера данных (в настоящее время хранящегося в...

Reid / 12 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...