Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов

У меня есть набор данных в этом формате:...

Himanshu Yadav / 16 мая 2019
1 голос
1 ответ

У меня есть кадр данных, который выглядит как key | value | time | status x | 10 | 0 | running x |...

marisbest2 / 16 мая 2019
0 голосов
0 ответов

Я хочу вставить данные в уже существующую многораздельную паркетную таблицу Hive с помощью Spark...

Nupur Bharati / 16 мая 2019
0 голосов
1 ответ

показывает .count (), но неправильно .sum (), что мне делать? код: def meanTemperature(df,spark):...

David Echo / 16 мая 2019
0 голосов
0 ответов

У меня есть стол улья create table json_tab ( c1 string, c2 int, c3 array<struct<c4:string,...

Joha / 16 мая 2019
1 голос
2 ответов

Я новичок в разжигании и пытаюсь поиграть с данными, чтобы получить тренировку. Я использую блоки...

kasturi76 / 16 мая 2019
1 голос
1 ответ

В моем фрейме данных есть столбец возраста.Общее количество строк составляет около 77 миллиардов.Я...

Nikita Agarwal / 16 мая 2019
0 голосов
1 ответ

В этом запросе мне дан кадр данных со столбцом 5d евклидовых точек (хранится в виде массива двойных...

user132226 / 16 мая 2019
1 голос
1 ответ

У меня есть несколько строковых значений в одном столбце, и я хотел бы заменить подстроки в этом...

Tiffany / 16 мая 2019
1 голос
2 ответов

Попытка заменить ноль на 0 в кадре данных, используя UDF ниже. Там, где я могу ошибаться, код...

Pavan_Obj / 15 мая 2019
0 голосов
1 ответ
0 голосов
0 ответов

У меня есть требование, при котором я должен динамически генерировать несколько столбцов в pyspark....

user11490741 / 15 мая 2019
0 голосов
1 ответ

Мне нужно записать мой набор искровых данных в таблицу базы данных Oracle.Я использую метод записи...

CodeRunner / 15 мая 2019
0 голосов
0 ответов
0 голосов
1 ответ

У меня есть UDF в pyspark, как показано ниже для преобразования строки в метку времени...

syv / 15 мая 2019
10 голосов
1 ответ

У меня есть два кадра данных, для которых я пытаюсь найти разницу. 2 кадра данных содержат массивы...

user3407267 / 15 мая 2019
0 голосов
0 ответов
0 голосов
1 ответ

Я хочу рассчитать среднее значение для каждого города (группового города), используя RDD и данные....

Gyu-lim Shim / 14 мая 2019
1 голос
1 ответ

Предположим, у меня есть следующий DataFrame: import pandas as pd import numpy as np np.random

pault / 14 мая 2019
0 голосов
0 ответов

Я настроил драйвер spark odbc на виртуальной машине Azure. Создан системный DSN для подключения...

Amruta / 14 мая 2019
0 голосов
2 ответов

Когда я пытаюсь создать фрейм данных со схемой в приведенном ниже коде, он не работает, и если это...

Sainath / 14 мая 2019
1 голос
0 ответов

У меня есть задание spark (spark 2.1), которое обрабатывает потоковые данные, используя прямой...

Liz / 14 мая 2019
1 голос
0 ответов

Я следовал этому примеру для вычисления TFIDF каждого слова в моих документах.Однако мой...

scarface / 13 мая 2019
0 голосов
1 ответ

Я создал набор данных Spark из CSV-файла. Схема: |-- FirstName: string (nullable = true)<br>...

CoolBird / 13 мая 2019
0 голосов
1 ответ

Попытка подключения к Hbase с использованием искры на основе приведенной ниже документации,...

William R / 13 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...