Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
1 ответ

Я знаю, что мы можем заменить значения в столбце данных и вернуть новый кадр данных с обновленными...

Abhishek Choudhary / 01 июня 2018
0 голосов
1 ответ

У меня огромный набор данных с почти 600 столбцами, но, хотя я пытаюсь создать DF, происходит сбой...

sande / 01 июня 2018
0 голосов
1 ответ

У меня есть фрейм данных в PySpark, как показано ниже. import pyspark.sql.functions as func df =...

Question_bank / 01 июня 2018
0 голосов
0 ответов

У меня ниже 3 sqls. select count(distinct visitor_id) from df_and_lkp_join_cache --178996 select...

ashwani gupta / 01 июня 2018
0 голосов
1 ответ

У меня есть строка, разделенная запятой.Я хочу удалить все данные перед моей второй запятой вместе...

sande / 01 июня 2018
0 голосов
0 ответов

18/05/31 18:33:45 WARN Utils: Truncated the string representation of a plan since it was too large....

Mahanthy Seetharam / 31 мая 2018
0 голосов
1 ответ

Я новичок в Zeppelin (и spark & ​​sql) и пытаюсь запустить пример в блокноте Zeppelin.Я не могу...

john / 31 мая 2018
0 голосов
0 ответов

Я использую spark-sql в среде Hortonworks HDP 2.6.4 Sandbox.Я создал 2 очень простые таблицы в...

Kai Chaza / 31 мая 2018
0 голосов
2 ответов

У меня есть Dataframe с 2 столбцами tag и value. Я хочу добавить новый столбец, содержащий столбец...

Nakeuh / 31 мая 2018
0 голосов
0 ответов

все. Я пытался использовать beeline для подключения к Spark Thrift Server, и данные находятся в...

hu li / 31 мая 2018
0 голосов
1 ответ
0 голосов
0 ответов

У меня есть коллекция MongoDB с 26 000 записей, которые я читаю в DataFrame.У него есть столбец...

anitneil / 31 мая 2018
0 голосов
0 ответов
0 голосов
0 ответов

Как можно использовать базу данных InfluxDB (в которую поступают потоковые данные) в качестве...

Mark B. / 31 мая 2018
0 голосов
0 ответов
0 голосов
1 ответ

У меня есть df, и мне нужно искать, есть ли какой-либо набор элементов из списка ключевых слов или...

nitesh jha / 31 мая 2018
0 голосов
2 ответов

У меня есть данные в файле, как показано ниже: 7373743343333444. 7373743343333432. Эти данные...

Venkat J / 31 мая 2018
0 голосов
0 ответов

Мой код написан на Spark и Scala.Теперь мне нужно измерить прошедшее время определенных функций...

ScalaBoy / 31 мая 2018
0 голосов
1 ответ

Используя spark и scala, я хотел бы установить структуру и использовать одно из значений столбца в...

Dimac / 31 мая 2018
0 голосов
1 ответ

Я пытаюсь определить несколько отсортированных выходных данных, используя наборы данных в искре...

rushikesh jachak / 31 мая 2018
0 голосов
1 ответ

Попытка преобразовать базу данных postgreSQL в Dataframe.Вот мой код: from pyspark.sql import...

K.Pil / 31 мая 2018
0 голосов
0 ответов

Я создаю искровое задание, и часть кода, о которой идет речь, выглядит следующим образом: var...

johnnydonna / 31 мая 2018
0 голосов
2 ответов

Как я могу вычислить tf-idf, сгруппированный по столбцу, а не по всему фрейму данных? Предположим,...

Mohan / 30 мая 2018
0 голосов
1 ответ

когда я использую func.when () в pyspark, я обозначаю как ` TypeError: 'Column' object is...

Sham / 30 мая 2018
0 голосов
1 ответ

У меня есть текстовый файл, и у меня есть данные, подобные приведенным ниже:...

tryingSpark / 30 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...