Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов

Я использую здесь Java, и мои текущие наборы данных выглядят так: набор данных d1 (где столбец c1...

Prateek Jain / 21 сентября 2018
0 голосов
0 ответов

Я пытаюсь выполнить тестовые случаи из spark-testing-base , я пытаюсь выполнить этот тест, но по...

Srinivas / 21 сентября 2018
0 голосов
1 ответ

Я читаю 30 миллионов записей из таблицы оракулов без столбцов первичного ключа.При чтении spark...

Ramakrishna / 21 сентября 2018
0 голосов
1 ответ

Я новичок в PySpark, но мне удалось заставить работать ниже. У меня есть еще 2 требования, оба из...

kikee1222 / 21 сентября 2018
0 голосов
2 ответов

Вероятно, это дубликат, но каким-то образом я уже давно ищу: Я хочу получить число нулей на строку...

guscht / 21 сентября 2018
0 голосов
1 ответ

Я искал альтернативу для SQL-запроса в Spark Scala, в частности, Мой запрос ниже: CAST( COLUMN as...

Sundeep Pidugu / 21 сентября 2018
0 голосов
1 ответ

Если я читаю данные из CSV, по умолчанию все столбцы будут иметь тип «String».Обычно я проверяю...

Ali / 21 сентября 2018
0 голосов
1 ответ

У меня есть существующие паркет (скажем, p1) для чтения в информационный кадр, а затем после...

mdivk / 20 сентября 2018
0 голосов
1 ответ

Я новичок в PySpark и работаю над сценарием, читая из .csv файлов. Я четко определил схему ниже, и...

kikee1222 / 20 сентября 2018
0 голосов
1 ответ

Как установить значение по умолчанию для pyspark.sql.functions.lag на значение в текущей строке?...

David / 20 сентября 2018
0 голосов
1 ответ

У меня есть DataFrame со следующей схемой: root |- documentId |- timestamp |- anotherField Например...

Nik / 20 сентября 2018
0 голосов
0 ответов

Я объясняю проблему с небольшим набором данных с 4 столбцами.У меня есть кумулятивная матрица...

Arun / 20 сентября 2018
0 голосов
0 ответов

Я хочу закодировать категориальные характеристики кадра данных искры (df), используя средний...

Saeid SOHEILY KHAH / 20 сентября 2018
0 голосов
0 ответов

ApplicationMaster: Исключение класса пользователя: org.apache.spark.sql.AnalysisException: Таблица...

maxime G / 20 сентября 2018
0 голосов
2 ответов

ПРИМЕЧАНИЕ. Это только краткий пример данных.Не имеет смысла по сравнению с реальной командой по...

AntonyP / 20 сентября 2018
0 голосов
1 ответ

Я пытаюсь сравнить производительность между SparkSql на Parquet и Phoenix на HBase.Запрашиваемый...

Ayan Biswas / 20 сентября 2018
0 голосов
2 ответов

сильный текст Почему этот этап выполняется с 1 потоком в конце?Из-за этого требуется много времени,...

Suresh G / 20 сентября 2018
0 голосов
0 ответов

Используйте hiveContext.sql, чтобы выполнить скрипт ниже: with nt as ( select label, score from (...

Yuchen Gu / 20 сентября 2018
0 голосов
0 ответов

Я не могу создать Apache Spark Dataframe со структурированным пустым ключом JSON, как показано ниже...

abdulrahman Mohammed / 20 сентября 2018
0 голосов
3 ответов

Как использовать искровой SQL-фильтр в качестве чувствительного к регистру фильтра на основе...

xyz_scala / 20 сентября 2018
0 голосов
1 ответ

Dataset<Row> ds = spark.read().option("multiLine", true).option("mode",...

Bar / 20 сентября 2018
0 голосов
1 ответ

У меня есть некоторый DataFrame со столбцом "date", и я пытаюсь сгенерировать новый...

LDropl / 19 сентября 2018
0 голосов
1 ответ

Я немного тренируюсь в Spark и задаюсь вопросом об оптимизации одной из моих задач.Цель проста:...

kacperdominik / 19 сентября 2018
0 голосов
1 ответ
0 голосов
0 ответов

Цель Если withColumn еще не работает параллельно, мне нужно распараллелить функциональность...

pehr.ans / 19 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...