Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
0 ответов

Мы знаем, что df.columns предоставляет имена столбцов, df.dtypes предоставляет имена столбцов и их...

icarus / 03 сентября 2018
0 голосов
1 ответ

Я использую PySpark (2.3) в кластере Dataproc с 3 узла (4 процессора) 8 ГБ памяти каждый. Данные...

user1411837 / 02 сентября 2018
0 голосов
2 ответов

Недавно я начал использовать Apache Spark для сортировки большого количества данных. В моих...

Bruno / 02 сентября 2018
0 голосов
2 ответов

У меня есть некоторый фрейм данных, который имеет миллионы строк. Мне нужно выбрать все строки из...

user3607698 / 02 сентября 2018
0 голосов
2 ответов
0 голосов
1 ответ

У меня есть пример таблицы, как показано ниже (у меня есть 1 миллион таких строк), из этого мне...

user3607698 / 01 сентября 2018
0 голосов
0 ответов

Я получил следующую ошибку в моей .describe() функции с использованием PySpark. Кажется, все...

Reza / 31 августа 2018
0 голосов
2 ответов

Я работаю над Spark Scala, и существует требование сохранить Map[String, String] на диск, чтобы...

Don Sam / 31 августа 2018
0 голосов
2 ответов

Я установил Spark 2.3.0 в Ubuntu 18.04 с двумя узлами: основным (ip: 172.16.10.20) и подчиненным...

Xavier Prudent / 31 августа 2018
0 голосов
1 ответ

У меня есть файл типа json (не настоящая структура json), но я преобразовал его в json и прочитал...

user2883350 / 31 августа 2018
0 голосов
1 ответ

Предположим, у нас есть следующий DataFrame в (Py) Spark. (Я взял данные из этого вопроса .)...

H. Shindoh / 31 августа 2018
0 голосов
0 ответов

При создании внешней таблицы с разделом в кусте с использованием spark в формате csv com.databricks

Vicky / 31 августа 2018
0 голосов
1 ответ
0 голосов
1 ответ

В фрейме данных spark у меня есть 1 столбец, содержащий список в виде строк. Я хочу объединить...

Surbhi Jain / 30 августа 2018
0 голосов
1 ответ

Я знаю искру, но новичок в alteryx. Может кто-нибудь пролить свет на мой следующий вопрос. сравнить...

sparken / 30 августа 2018
0 голосов
1 ответ

У нас есть сотни разделов HDFS, которые мы пишем в каждый час дня. Разделы предназначены для...

Mad Dog / 30 августа 2018
0 голосов
2 ответов

DF1 - это то, что у меня сейчас, и я хочу, чтобы DF1 выглядел как DF2. Желаемый вывод: DF1 DF2...

Allen / 30 августа 2018
0 голосов
0 ответов

Я использую SparkLauncher для того, чтобы подавать заявки на спарк. Я хотел бы перенаправить...

user3725190 / 30 августа 2018
0 голосов
1 ответ

У меня есть Spark RDD, как показано ниже: СДР [строка] со значениями вроде: (00,"asfad",...

noobtoPro / 30 августа 2018
0 голосов
1 ответ
0 голосов
1 ответ

df = sc.textFile("hdfs://n21-01-03/algo/ml_platform/downsample_data/nl/20180828/*/part-*

yanachen / 30 августа 2018
0 голосов
0 ответов

При загрузке CSV-файла, есть возможность удалить неправильно сформированные записи. Можем ли мы...

getitout / 30 августа 2018
0 голосов
2 ответов
0 голосов
1 ответ

Схема: |-- c0: string (nullable = true) |-- c1: struct (nullable = true) | |-- c2: array (nullable...

vikky / 30 августа 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...