Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов
0 голосов
0 ответов

У меня есть фрейм данных (df), который состоит из 10K строк. Мой фрейм данных выглядит как - id...

Nikita Agarwal / 18 июня 2019
1 голос
2 ответов

Объяснить мой вопрос иначе: Этот вопрос отличается от отмеченного. Во-первых, входной параметр уже...

Litchy / 18 июня 2019
0 голосов
0 ответов

Я хочу прочитать буквенно-цифровое поле файла json без кавычек: Я пытался преобразовать это поле в...

Bhawani Singh / 18 июня 2019
1 голос
0 ответов

Я хотел бы эффективно вставить содержимое фрейма pyspark в Redis. Попытка нескольких методов, но ни...

user2407164 / 18 июня 2019
1 голос
1 ответ

Я новичок в pyspark.Я пытаюсь извлечь столбцы данных, используя конфигурационный файл, который...

shijugm / 18 июня 2019
0 голосов
1 ответ

Я хочу перебрать искровой фрейм данных, проверить, является ли условие, т. Е. Агрегированное...

mike_c84 / 18 июня 2019
0 голосов
1 ответ

Впервые в Spark и PySpark я пытаюсь добавить поле / столбец в DataFrame путем поиска информации в...

Leo Saguisag / 18 июня 2019
0 голосов
1 ответ

Использование EMR с 4 рабочими и 1 мастером метка выпуска: emr-5.24.0 Распределение Hadoop: Amazon...

Thom Rogers / 18 июня 2019
0 голосов
0 ответов

Эксперты, я использую Spark 1.6.0 с Python (2.7) и сталкиваюсь с проблемой, когда моя работа...

Sidd / 18 июня 2019
0 голосов
0 ответов

Я подозреваю, что это довольно простой ответ, но я проклят, если смогу разобраться. Из документов...

Thom Rogers / 18 июня 2019
0 голосов
0 ответов

У меня есть два искровых кадра данных, к которым я пытаюсь присоединиться. Я пытаюсь соединить два...

Chai Goyal / 18 июня 2019
0 голосов
1 ответ

Я делаю классификацию текста и использую pyspark.ml.feature.Tokenizer для токенизации текста....

zs2020 / 17 июня 2019
2 голосов
2 ответов

У нас есть база данных временных рядов для пользовательских событий, которая выглядит следующим...

Yuchen Zhong / 17 июня 2019
0 голосов
1 ответ

Допустим, у меня есть следующие данные в кадре данных receipts: Id | Фрукты 1 | ['яблоко', 'банан']...

Sequinex / 17 июня 2019
0 голосов
1 ответ

Я пытаюсь записать фрейм данных в cassandra, используя pyspark, но я получаю сообщение об ошибке:...

Umar / 17 июня 2019
0 голосов
1 ответ

Я запускаю следующий код в сеансе оболочки pyspark. Запуск collect_list () после groupBy изменяет...

ntipakos / 17 июня 2019
0 голосов
0 ответов

Я запрашиваю таблицу mysql со столбцом первичного ключа, используя spark. Мне не нужно читать всю...

Kundan Jha / 17 июня 2019
0 голосов
2 ответов

У меня есть один файл json со 100 столбцами, и я хочу прочитать все столбцы вместе с...

Bhawani Singh / 17 июня 2019
0 голосов
1 ответ

У меня есть 2 схемы JSON, как показано ниже - df1.printSchema () # root # |-- name: string...

jakrm / 17 июня 2019
1 голос
2 ответов

У меня есть датафрейм df в настройке PySpark.Я хочу изменить столбец, скажем, он называется A, тип...

WorkBench / 17 июня 2019
1 голос
1 ответ
0 голосов
1 ответ

У меня есть фрейм данных с двумя столбцами, содержащими данные json. Я хочу проанализировать эти...

Cool Triks / 17 июня 2019
2 голосов
0 ответов

У меня есть данные, сохраненные в формате паркета в формате hdf, которые я хочу обработать с...

Nadeem Mehraj / 17 июня 2019
3 голосов
1 ответ

Я прочитал документацию как pandas.read_csv, так и pyspark.sql.DataFrameReader.csv, и кажется, что...

fahadh4ilyas / 17 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...