Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
1 ответ

Я использовал LDA для поиска темы ref: из pyspark.ml.clustering import LDA lda = LDA (k = 30, seed...

Arun Gunalan / 13 мая 2019
2 голосов
1 ответ
0 голосов
1 ответ

Для сценария, который я запускаю, у меня есть несколько связанных цепочек представлений, которые...

Josh / 13 мая 2019
0 голосов
1 ответ

Я пытаюсь заставить потоковую агрегацию / groupBy работать в режиме вывода дополнений, чтобы иметь...

jammann / 13 мая 2019
0 голосов
0 ответов

Для универа мне нужно проанализировать список паролей, который выглядит примерно так:...

In0cenT / 13 мая 2019
0 голосов
0 ответов

У меня есть dataframe с 5 столбцами. Мне нужно динамически проверять столбцы на наличие нулевых...

Sudheer Nulu / 13 мая 2019
1 голос
1 ответ

У меня есть df с одним столбцом type, и у меня есть два списка women = ['0980981',...

Mrinal / 13 мая 2019
0 голосов
1 ответ

У меня есть датафрейм countriesDF со схемой root |-- _id: struct (nullable = true) | |-- $oid:...

deaky / 12 мая 2019
0 голосов
1 ответ

Кадр данных в виде значений na, Nan и Null. Схема (имя: строка, номер ролика: целое число, отдел:...

premon / 12 мая 2019
2 голосов
2 ответов

У меня есть датафрейм. Мне нужно вычислить максимальную длину значения String в столбце и вывести...

Shashank V C / 11 мая 2019
1 голос
2 ответов

У меня есть фрейм данных df_one, df_two, как показано ниже: df_one.show() -------------...

user11485597 / 11 мая 2019
1 голос
1 ответ

Я новичок в Apache Spark.Ниже мой Spark dataframe, который создается, когда я читаю CSV-файл....

Anand / 11 мая 2019
0 голосов
0 ответов

У меня есть сценарий использования, в котором я должен проверить, является ли значение поля длинным...

jatin / 11 мая 2019
0 голосов
1 ответ

Я создал PyDpark RDD (преобразованный из XML в CSV), у которого нет заголовков.Мне нужно...

Annabanana / 11 мая 2019
0 голосов
1 ответ

Я пытаюсь отфильтровать записи из фрейма данных, которые не равны (! =) Значениям из нескольких...

Naresh Krishnamoorthy / 11 мая 2019
3 голосов
1 ответ

Я использую этот запрос в SQL, чтобы узнать, сколько user_id имеют более одного электронного письма

KurryF / 10 мая 2019
0 голосов
0 ответов

Я все еще новичок в scala, у меня есть требование извлечь первый раздел из каждой таблицы в улье. Я...

Karthik Ramachandran / 10 мая 2019
0 голосов
0 ответов

Я использовал потоковую обработку Spark 2.1 для обработки данных о событиях от Kafka. После...

Liz / 10 мая 2019
0 голосов
2 ответов

Предположим, у меня есть такой фрейм данных val customer = Seq( ("C1", "Jackie...

Srinivas / 10 мая 2019
0 голосов
2 ответов

Я пытаюсь создать новый столбец данных (b), удаляя последний символ из (a).Столбец a - это строка...

David / 10 мая 2019
0 голосов
1 ответ

Язык - Scala Версия Spark - 2,4 Я новичок в Scala и Spark. (Я из Python, поэтому вся экосистема JVM...

Vijayant / 10 мая 2019
0 голосов
0 ответов

Я пытаюсь загрузить данные из БД MapR в Spark DF. Тогда я просто пытаюсь экспортировать DF в файлы...

Temp Expt / 10 мая 2019
4 голосов
2 ответов

У меня есть таблица, как показано ниже id week count A100 201008 2 A100 201009 9 A100 201010 16...

a m Sreekanth / 10 мая 2019
1 голос
2 ответов
0 голосов
1 ответ
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...