Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

Мне нужно закодировать столбец в большой DataFrame в pyspark (spark 2.0).Все значения практически...

Dmitriy Kolomiets / 20 мая 2018
0 голосов
2 ответов

я пытаюсь перебрать JavaRDD и найти элемент, применяя метод, который использует этот RDD, а затем я...

user9467051 / 20 мая 2018
0 голосов
1 ответ

Я работаю над моделью языка и хочу посчитать пары чисел двух последовательных слов.Я нашел примеры...

Daniel Chepenko / 20 мая 2018
0 голосов
2 ответов

я пытаюсь прочитать xml / вложенный xml в pysaprk uing spark-xml jar. df = sqlContext.read \

LUZO / 19 мая 2018
0 голосов
0 ответов

Независимо от того, сколько ресурсов я вкладываю в систему, оно не может быть меньше 11 минут. Я...

Alchemist / 19 мая 2018
0 голосов
1 ответ

У меня есть файл json, структура которого [{"time", "currentStop", "lat", "lon", "speed"}], вот...

Marbo / 19 мая 2018
0 голосов
1 ответ

У меня очень широкий массив данных со столбцами меток.Я хочу запустить логистическую регрессию для...

Kertis van Kertis / 19 мая 2018
0 голосов
1 ответ

Я читаю канал твитера в формате json, чтобы узнать количество пользователей.Некоторые строки во...

Rvsvgs / 19 мая 2018
0 голосов
1 ответ
0 голосов
1 ответ

Я работаю в pyspark и у меня есть следующий код, где я обрабатываю твит и создаю RDD с user_id и...

Rvsvgs / 19 мая 2018
0 голосов
1 ответ

Я нашел похожую тему: Понимание кэширования Spark но это все еще не точный мой вопрос.Давайте...

Michocio / 18 мая 2018
0 голосов
1 ответ

Я пытаюсь создать приложение spark, которое считывает данные из таблицы Hive, и вывод будет записан...

Srinivas / 18 мая 2018
0 голосов
3 ответов

У меня есть фрейм данных с очень большим количеством столбцов (> 30000). Я заполняю его 1 и 0 на...

Kertis van Kertis / 18 мая 2018
0 голосов
1 ответ

Я новичок в Python.Я также новичок в pysaprk.Я пытаюсь запустить строку кода, которая принимает (kv...

user3446905 / 18 мая 2018
0 голосов
2 ответов

снимок экрана полный снимок экрана Iобъединились в два RDD, используя pyspark, но, разбивая их и...

sravan / 18 мая 2018
0 голосов
0 ответов

У меня есть работа, которая перебирает столбцы таблицы, чтобы получить различные значения каждого...

José / 18 мая 2018
0 голосов
0 ответов

Я пытаюсь сделать что-то простое здесь.Получите строки из pyodbc и используйте их в качестве...

NEO / 17 мая 2018
0 голосов
2 ответов

Я хочу изменить значение в определенной ячейке моего Spark DataFrame, используя PySpark. Простой...

NuValue / 17 мая 2018
0 голосов
1 ответ

Я только начал изучать Python. Я использую API для построения модели TFIDFs, однако я сталкиваюсь с...

user3446905 / 17 мая 2018
0 голосов
1 ответ

Я пытаюсь выполнить свой первый код PySpark в PyCharm IDE и сталкиваюсь со следующим исключением....

kashyap / 17 мая 2018
0 голосов
1 ответ

Я только начал изучать Python. Я использую API для построения модели IDF, однако я сталкиваюсь с...

user3446905 / 17 мая 2018
0 голосов
1 ответ

Могу ли я получить ссылку на API Java + Spark SQL доступ к хранилищу объектов EMC через API S3. Я...

ChineseHunk / 17 мая 2018
0 голосов
1 ответ

У меня есть кадр данных в pyspark, как показано ниже.Я хочу сделать groupby и подсчет столбца...

Question_bank / 17 мая 2018
0 голосов
0 ответов

У меня есть небольшой файл размером всего 1,5 КБ, который записывается в S3 всего лишь в 1 файл. Я...

simplycoding / 16 мая 2018
0 голосов
1 ответ

У меня есть набор данных в Spark, где есть два столбца: строковый столбец (строка состоит из года в...

Danny / 16 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...