Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
2 ответов

Я пишу функцию проверки, которая должна проверить, что: A Dataset<Row> ds имеет столбцы col1...

Dror / 06 мая 2019
0 голосов
1 ответ

Я использую Apache-Spark SQL и Java для чтения из файла паркета.Файл содержит столбец даты...

user812142 / 06 мая 2019
0 голосов
0 ответов

Я пытаюсь настроить поступление данных Кафки в реальном времени в HBase через PySpark в...

thedbogh / 06 мая 2019
0 голосов
1 ответ

Я работаю в фильтрации avro-файла в спарк с использованием Java. Я получаю разные кадры данных для...

Dhara Dhruve / 04 мая 2019
0 голосов
0 ответов

Я пытаюсь прочитать таблицу из Oracle 11g XE через мой искровой SBT-проект на Intellij, он выдает...

rupesh kumar / 03 мая 2019
3 голосов
1 ответ

Учитывая, что документация pySpark для SQLContext говорит: «Начиная с Spark 2.0, это заменяется...

Clay / 03 мая 2019
0 голосов
0 ответов

Мы запускаем pyspark в кластере EMR и имеем ~ 50 миллионов записей в кадре данных.Каждому требуется...

kylerm42 / 03 мая 2019
1 голос
1 ответ

Я выполнил настройкуpretionIO v0.13 на моем компьютере с Linux в Docker (работает в режиме роя)....

tamassoltesz / 03 мая 2019
1 голос
3 ответов

У меня есть датафрейм, и мне нужно посмотреть, содержит ли он нулевые значения.Есть много постов на...

Clock Slave / 03 мая 2019
0 голосов
1 ответ
1 голос
1 ответ

Я пытаюсь использовать Intellij, чтобы протестировать мой искровой скала-код, который потребуется...

Sifang / 03 мая 2019
0 голосов
1 ответ

Я пытаюсь подключить сервер teradata через PySpark. Мой код CLI, как показано ниже, from pyspark

Soumya / 03 мая 2019
0 голосов
0 ответов

У меня есть таблица Hive, в которой есть базовые файлы в формате Avro со схемой (xyz.avsc),...

rightjoin / 03 мая 2019
0 голосов
2 ответов

Я пытаюсь загрузить файл, состоящий из одной строки, во всем файле нет новых линейных символов,...

Achyuth / 02 мая 2019
0 голосов
2 ответов
1 голос
1 ответ

В Amazon S3 у меня есть папка с около 30 подпапками, в каждой подпапке содержится один CSV-файл. Я...

Tim496 / 02 мая 2019
0 голосов
0 ответов

Я создаю сеанс спарка с минимальной конфигурацией ниже: hive.metastore.uris:...

Aditya Singh / 02 мая 2019
0 голосов
1 ответ

У меня есть три столбца в фрейме данных PySpark: ID, Y и пустой столбец X. data = spark.read

Cowboy_Owl / 02 мая 2019
0 голосов
2 ответов

У меня очень простой фрейм данных в pyspark, что-то вроде этого: from pyspark.sql import Row from...

JMzance / 02 мая 2019
0 голосов
2 ответов

это первый раз, когда я спрашиваю об этом. У меня есть датафрейм, как это...

Nghĩa Nguyễn / 02 мая 2019
0 голосов
1 ответ

Я настроил Spark для многоузлового кластера, как описано в этой статье: https://medium

eTothEipiPlus1 / 01 мая 2019
0 голосов
2 ответов

Я хочу преобразовать эту СДР: [(['1', '2', '3'], 'abc'),...

user2187513 / 01 мая 2019
0 голосов
1 ответ

Я запускаю pyspark в Windows и реализую алгоритм, который ранее был реализован в python Я...

Rahmat Ullah Orakzai / 30 апреля 2019
0 голосов
0 ответов

У меня проблемы с преобразованием нескольких столбцов из категориальных в числовые значения.Я...

David Kabii / 30 апреля 2019
1 голос
0 ответов

Есть ли способ интегрировать потоковую передачу Apache Spark с Apache Hive и Apache Kafka в одном...

lokesh / 30 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...