Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
2 ответов

введите описание изображения здесь Я могу подключиться к MYSQL во время выполнения моего кода...

TEJASWAKUMAR SIRIGIRI / 29 декабря 2018
0 голосов
0 ответов

Мы разработали библиотеку Scala для работы на искре под названием FV.Мы также создали обертки в...

alexlipa / 29 декабря 2018
0 голосов
3 ответов

У меня есть фрейм данных, который выглядит следующим образом: +------------+------+ | food|pounds|...

nad / 29 декабря 2018
0 голосов
1 ответ

Я студент, я действительно застрял с этой проблемой Py4JJavaError в течение двух недель, в...

I S H A 5 E / 29 декабря 2018
0 голосов
2 ответов

Я новичок в PySpark.Я играл с TFIDF.Просто хотел проверить, дают ли они одинаковые результаты.Но...

lU5er / 28 декабря 2018
0 голосов
1 ответ

Я сгенерировал модель PySpark Word2Vec следующим образом: from pyspark.ml.feature import Word2Vec...

Chris C / 28 декабря 2018
0 голосов
1 ответ

У меня есть таблица в hive, созданная из многих файлов json с использованием метода hive-json-serde...

lugger1 / 28 декабря 2018
0 голосов
1 ответ

У меня есть следующая строка кода: display(df2.groupBy("TransactionDate")

user1761806 / 28 декабря 2018
0 голосов
0 ответов

Я пытаюсь загрузить файл в spark с помощью pyspark, я получаю эту ошибку, не могу понять, проблема...

tunned / 28 декабря 2018
0 голосов
1 ответ

Как преобразовать объект класса Python с полями, в которых создаются другие классы, в DataFrame?Я...

Yuriy / 28 декабря 2018
0 голосов
1 ответ

У меня есть код ниже, который находится в PySpark, df1 = spark.range(2, 10000000, 2) df2 = spark

Chandan392 / 28 декабря 2018
0 голосов
2 ответов

Имея разделенную таблицу Hive CREATE EXTERNAL TABLE IF NOT EXISTS CUSTOMER_PART ( NAME string , AGE...

Joby / 28 декабря 2018
0 голосов
1 ответ

Я пытаюсь создать схему следующим образом: root |-- _ehid: string (nullable = true) |-- duration:...

Сергей Ярымов / 28 декабря 2018
0 голосов
1 ответ

У меня есть sql, в основном это соединение двух таблиц и получение результата admm_sk , если...

marjun / 28 декабря 2018
0 голосов
1 ответ

Я получаю эту ошибку: [FATAL tini (9)] exec /usr/local/spark-2.3.1-bin-hadoop2.7/bin/pyspark...

Houssein Kemel / 28 декабря 2018
0 голосов
1 ответ

В настоящее время pyspark форматирует logFile, затем загружает красное смещение. Анализирует каждый...

田村尚也 / 28 декабря 2018
0 голосов
0 ответов

У меня есть школьная работа на основе этой проблемы веб-сайт - мы используем набор данных,...

fips17 / 28 декабря 2018
0 голосов
2 ответов

Я пытаюсь удалить только слова, которые являются числовыми, из моего массива слов, но созданная...

user3661384 / 28 декабря 2018
0 голосов
0 ответов

У меня есть следующий образец данных ниже.Я выполняю код Python Pandas в своем блокноте Jupyter. No...

PineNuts0 / 27 декабря 2018
0 голосов
2 ответов

Может кто-нибудь сообщить мне, как фильтровать метку даты в файле У меня есть следующие файлы в...

Carltonp / 27 декабря 2018
0 голосов
0 ответов

У меня есть два фрейма данных PySpark, которые я пытаюсь объединить в новый фрейм данных.Кажется,...

lejin / 27 декабря 2018
0 голосов
1 ответ

Я настроил .bash_profile, как показано ниже.пожалуйста, дайте мне знать, если я что-то упустил...

prasanna Kumar / 27 декабря 2018
0 голосов
0 ответов

Я пытаюсь начать работу с transform и action функцией в PySpark впервые, но серьезно столкнулся с...

BANDI HEMANTH / 27 декабря 2018
0 голосов
1 ответ

У меня есть текстовый файл, который не разделен никаким символом, и я хочу разделить его на...

Akjpunia / 27 декабря 2018
0 голосов
2 ответов

У меня есть DF1, df1 = sc.parallelize([(1, "book1", 1), (2, "book2", 2), (3,...

Vicky / 27 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...