Вопросы с тегом bigdata - PullRequest

Вопросы с тегом bigdata

0 голосов
0 ответов

Я знаю, что Spark намного лучше работает с денормализованными таблицами, где все необходимые данные...

RLM / 20 февраля 2019
0 голосов
1 ответ

У меня есть строка, семейство столбцов h1 с двумя значениями id и name в таблице "hbase"...

Lakshminarayana / 20 февраля 2019
0 голосов
0 ответов

Мне нужно предложить архитектуру с продуктами GCP, но я не нашел ни одного продукта GCP для...

luis antonio Ramirez / 19 февраля 2019
0 голосов
0 ответов

У меня есть проект .net mvc.Этот веб-проект имеет экран, который может загрузить файл отчета с...

John / 19 февраля 2019
0 голосов
1 ответ

У меня есть корзина s3, которая ежедневно распределяет почти 14-15 миллиардов записей по 26000csv...

Jerin A Mathews / 19 февраля 2019
0 голосов
1 ответ

Я беру некоторые записи JSON из файла.Я хочу проанализировать json, а затем, основываясь на поле в...

apshr / 19 февраля 2019
0 голосов
0 ответов

Я пытаюсь установить PIG 0.17, используя windows и cygwin.Когда я выполняю следующую команду: pig...

Daksh / 18 февраля 2019
0 голосов
1 ответ
0 голосов
1 ответ

Я новичок в многопроцессорности в python, и мне было интересно, смогу ли я сделать это для анализа...

Angelina Thomas / 18 февраля 2019
0 голосов
1 ответ

Я разработал Java-приложение для запуска на Apache Storm.Мы будем устанавливать приложения на...

zackeriya / 18 февраля 2019
0 голосов
1 ответ

Мой набор данных состоит из 1,6 миллиона строк и 17000 столбцов после предварительной обработки.Я...

Priyanshi Somani / 18 февраля 2019
0 голосов
3 ответов

У меня есть несколько Map[String, String] в List (Scala).Например: map1 = Map("EMP_NAME"...

SAIYED / 17 февраля 2019
0 голосов
0 ответов

Я хотел бы создать индекс, который измеряет достоверность того, что говорит человек.пример в нижнем...

Davide / 17 февраля 2019
0 голосов
0 ответов

Когда я пытаюсь развернуть банку Apache Storm, разработанную мной с использованием Flux, я получаю...

zackeriya / 17 февраля 2019
0 голосов
0 ответов

Я хочу вычислить ковариацию между двоичным атрибутом и числовым атрибутом. Например: если x...

akb / 17 февраля 2019
0 голосов
0 ответов

У меня есть коробка с дисководами, в которой хранятся резервные копии рабочих и личных файлов на...

nn4l / 17 февраля 2019
0 голосов
1 ответ

Я пытаюсь использовать mapPartiton в spark для обработки большого текстового корпуса: допустим, у...

user8734221 / 16 февраля 2019
0 голосов
1 ответ

У меня есть 6 больших tsv-матриц по 60 ГБ (несжатых), содержащих 20 миллионов строк x 501 столбцов:...

tafelplankje / 15 февраля 2019
0 голосов
1 ответ

Я бы хотел «расширить» мою строку с: +-------------+---------+-------+-------+ | Week Number |...

Arnold Samuel Chan / 15 февраля 2019
0 голосов
1 ответ

У меня есть разреженная матрица с размерами ~ 400K x ~ 8k. Я хотел бы сохранить это как файл с...

user8433663 / 15 февраля 2019
0 голосов
1 ответ

это моя схема данных: `root |-- customerid: string (nullable = true) |-- event: string (nullable =...

b2ooba / 15 февраля 2019
0 голосов
1 ответ

Я хочу переставить несколько столбцов в таблице Spark SQL Я нашел это решение только для двух...

b2ooba / 14 февраля 2019
0 голосов
1 ответ

У меня есть большой фрейм данных с позициями, отметками времени, идентификаторами поездок и т. Д. Я...

Charlotte / 13 февраля 2019
0 голосов
0 ответов

Я не могу импортировать Tensorflow в Pysark2.Я получаю следующую ошибку Python 3.4.8 (default, Apr...

Gaurav Gupta / 13 февраля 2019
0 голосов
1 ответ

За последние несколько недель я написал конвейер, который собирает все данные о потоках кликов,...

Hazzamataza / 12 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...