Вопросы с тегом bigdata - PullRequest

Вопросы с тегом bigdata

0 голосов
0 ответов

У меня есть такой класс: Public class person { private String name; private String city; private...

Mansi / 03 декабря 2018
0 голосов
0 ответов

Если нет, можете ли вы предложить, как улучшить распределение по всем региональным серверам (без...

Siddesh H K / 03 декабря 2018
0 голосов
1 ответ

Я пытаюсь прочитать некоторые файлы avro в DataFrame из нескольких путей.Допустим, мой путь -...

R.Peretz / 03 декабря 2018
0 голосов
0 ответов

У меня есть набор данных с n = 100 000 наблюдений с p = 2 миллионами переменных.Я не могу загрузить...

RemiDav / 03 декабря 2018
0 голосов
0 ответов
0 голосов
0 ответов

Мне интересно, как я могу преобразовать огромные признаки рака молочной железы, которые (24481)...

Yousif Garabet / 01 декабря 2018
0 голосов
2 ответов

У меня есть система, которая каждую минуту проверяет состояние большого количества объектов по...

devnull / 30 ноября 2018
0 голосов
1 ответ

Я пытаюсь отправить данные из фрейма данных в Google Big Query. Я установил поле даты для фрейма...

ryguy72 / 30 ноября 2018
0 голосов
0 ответов

Есть ли способ написать пользовательскую функцию для захвата экрана в кусте

A.Jose / 30 ноября 2018
0 голосов
1 ответ

СБОЙ: RuntimeException MetaException (сообщение: org.apache.hadoop.hive.serde2.SerDeException...

SKK / 30 ноября 2018
0 голосов
0 ответов

Я изучаю платформу управления данными (DMP).Я понимаю, что одна из целей DMP - объединять и...

shanika yrs / 30 ноября 2018
0 голосов
0 ответов

Я пытаюсь выяснить, как обрабатывать большие объемы данных (до 1,5 Гб float64) на микросервисе,...

Ben / 29 ноября 2018
0 голосов
0 ответов

Я загружаю в файл CSV построчно, потому что в нем ~ 800 миллионов строк, и есть много таких файлов,...

user8188120 / 29 ноября 2018
0 голосов
1 ответ

У меня есть код, который преобразует потоковые данные Pyspark в dataframe.Мне нужно сохранить этот...

ariun ariun / 29 ноября 2018
0 голосов
1 ответ

Я работаю над набором данных, который имеет следующие столбцы: unique_ID Date a 2018_09_08 a...

Rishabh Dixit / 29 ноября 2018
0 голосов
0 ответов

Мы используем Jupyter для pyspark.Мы попытались запустить логистическую регрессию, которая не дала...

anmol majithia / 29 ноября 2018
0 голосов
1 ответ

У меня большой набор данных (> 1 ТБ), который я хочу обучить, используя GradientBoostingRegressor...

Chong Lip Phang / 28 ноября 2018
0 голосов
1 ответ

Я смотрел на оптимизацию некоторых довольно больших заданий Apache Spark и заметил, что...

krish7919 / 28 ноября 2018
0 голосов
1 ответ

когда я использую вложенный выбор в улье, как этот Select a.month, a.day, sum(a.pv)/count(a.*) from...

Spark Sun / 27 ноября 2018
0 голосов
1 ответ

Я открываю несколько файлов "csv" в Spark 2.2, но когда я делаю "подсчет", он возвращает 10000000...

Mat.cort / 26 ноября 2018
0 голосов
1 ответ

Я пытаюсь получить строки с нулевыми значениями из фрейма данных pyspark.В пандах я могу добиться...

dg S / 26 ноября 2018
0 голосов
1 ответ

Я новичок в PostgreSQL.Я делаю базу данных, и у меня проблема с файлом XML.Этот XML-файл имеет 986...

Lado / 26 ноября 2018
0 голосов
0 ответов

В настоящее время я использую mpl_toolkits.mplot3d с ~ 100k баллов.Однако вращение графика очень...

mobiguneci / 26 ноября 2018
0 голосов
1 ответ

Допустим, у меня есть 8 диспетчеров задач с 16 слотами для задач.Если я отправляю задание с помощью...

javalass / 26 ноября 2018
0 голосов
1 ответ

Мы работаем на IoT-устройствах с поддержкой HomeKit.HomeKit разработан для потребительского...

Nikita Zernov / 26 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...