Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

Я пытаюсь создать СДР из одного файла, который находится в локальной системе. Я использую Eclipse...

RushHour / 12 октября 2019
0 голосов
0 ответов

Я пытаюсь настроить соединение JDBC от Oracle Database к локальному pyspark на ноутбуке. В какую...

Jesse Nicholson / 12 октября 2019
0 голосов
2 ответов

У меня есть скрипт, который удаляет строки в текстовых файлах, хранящихся в HDFS . Данные разделены...

Lou_Ds / 12 октября 2019
0 голосов
1 ответ

Есть ли способ сохранить вложенные кавычки в значении фрейма данных pyspark при записи в файл (в...

lampShadesDrifter / 12 октября 2019
0 голосов
1 ответ

Я нашел несколько полезных ответов, но все они преобразовывали файл сына в df, в моем случае у меня...

semper doctrina / 11 октября 2019
0 голосов
0 ответов

У меня есть док-контейнер, в котором я установил SparklyR, и мне нужен доступ к HDFS / HIVE из...

H.Z. / 11 октября 2019
1 голос
1 ответ

ErrorMessage': 'An error occurred while calling o103.pyWriteDynamicFrame. Job aborted due...

Raffael / 11 октября 2019
2 голосов
2 ответов

Как я могу извлечь случайную выборку из 10000 элементов из моего искрового DataFrame? Мне нужно...

paolof89 / 11 октября 2019
0 голосов
2 ответов

Я новичок в Spark и наткнулся на следующую (возможно, простую) проблему. У меня есть СДР с...

user1551605 / 11 октября 2019
2 голосов
2 ответов

Я хочу сделать несколько разбиений в одном столбце моего кадра данных. Пример: s = "Cras...

daddou06 / 10 октября 2019
0 голосов
0 ответов

Я довольно новичок в пространстве Pyspark, и я сталкиваюсь со следующей ошибкой, когда пытаюсь...

Statistical_Slot / 10 октября 2019
0 голосов
0 ответов

Возможно ли выполнять операции DML, такие как обновление и удаление, в таблице RDBMS (oracle,...

chandra / 10 октября 2019
0 голосов
0 ответов

Я построил кластер из 3 узлов на Hadoop3 и хочу сравнить производительность политик кодирования...

António Mendes / 10 октября 2019
0 голосов
1 ответ

Я новичок в использовании серверов. На моем компьютере у меня нет проблем с использованием Apache...

Karencia Gárate / 10 октября 2019
1 голос
0 ответов

У меня есть медиа-файлы (изображения, аудио, видео) в качестве входных данных. Я хочу сохранить это...

arunDataEngineer / 10 октября 2019
0 голосов
1 ответ

Мой входной DataFrame выглядит следующим образом: +-------+ |Column1| +-------+ |FILE_1 | |11 | |12...

Nikk / 10 октября 2019
0 голосов
0 ответов

У меня странная проблема в среде Databricks. Я пытаюсь выполнить некоторую отладку, но результаты...

juske / 10 октября 2019
1 голос
1 ответ

Я очень новичок в pySpark. Благодарим Вас за помощь. У меня есть фрейм данных...

Oleg Zdanevich / 10 октября 2019
1 голос
1 ответ

У меня есть PySpark UDF, который возвращает кортеж String, который я закодировал как структуру. Вот...

John / 10 октября 2019
1 голос
0 ответов

Прежде всего, я работаю с PySpark на Glue и читаю несколько очень больших CSV-файлов. Эти CSV-файлы...

Raffael / 09 октября 2019
0 голосов
1 ответ

У меня есть приведенный ниже фрейм данных, и я хотел динамически обновить строки с некоторыми...

newbie / 09 октября 2019
0 голосов
0 ответов

Когда пути s3 явно указаны для чтения паркетных файлов, которые не находятся в одном и том же...

harish1792 / 09 октября 2019
1 голос
1 ответ

Я хочу прочитать некоторые данные из Рadoop напрямую из spark worker: Итак, в программе spark у...

Andrew / 09 октября 2019
0 голосов
1 ответ

Я могу подтвердить, что подключение к кластеру с помощью spark-shell например spark-shell --master...

xiaodai / 09 октября 2019
0 голосов
3 ответов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...