Вопросы с тегом bigdata - PullRequest

Вопросы с тегом bigdata

0 голосов
1 ответ

Я хочу получить данные из большого запроса Google. Но аутентификация пользователя не происходит для...

Sajith Sudhi / 14 мая 2018
0 голосов
0 ответов

У меня есть набор данных размером ~ 1T, и я хочу совместить с ним модель гребня / лассо

bill / 13 мая 2018
0 голосов
1 ответ

Предположим, нам нужно построить фильтр Блума с 10 ^ 12 сегментами на одной машине с 32 ГБ ОЗУ и...

Zhetao Zhuang / 13 мая 2018
0 голосов
2 ответов

Мне нужно разбить большой файл (14 гигабайт) на файлы меньшего размера.Формат этого файла txt,...

Joyce Maia / 13 мая 2018
0 голосов
1 ответ

Как я могу создать файл CSV больше моей оперативной памяти, используя Python (и, возможно, Pandas)

Miha / 12 мая 2018
0 голосов
1 ответ

Я использую Cassandra 3.x и у меня есть следующая таблица: CREATE TABLE sp_db.prod_tag ( year int,...

brxie / 12 мая 2018
0 голосов
1 ответ

Мне постоянно приходится работать с большими массивами в Java, постоянно проверять ограничение...

Denis Kulagin / 11 мая 2018
0 голосов
1 ответ

У меня есть набор данных, который составляет 60 миллионов строк, и я хочу вычислить сравнение для...

user137698 / 11 мая 2018
0 голосов
0 ответов

Я работаю со значениями данных, поступающими от датчиков. Эти данные чрезвычайно велики. Если я...

Chaouki / 11 мая 2018
0 голосов
0 ответов
0 голосов
1 ответ

Динамическое разбиение, введенное в Spark 2.3, похоже, не работает на AWS EMR 5.13.0 при записи в...

David Costa Faidella / 10 мая 2018
0 голосов
1 ответ

Я использую Apache Nutch для сканирования сайтов.Когда я использую команду readseg для чтения...

Murthy Routhula / 10 мая 2018
0 голосов
2 ответов

так что это относительно простой вопрос.У меня есть таблица postgresql, которую мне нужно записать...

Graydon Neill / 10 мая 2018
0 голосов
0 ответов

Я запускаю две банки. каждый запускает экземпляр воспламенения (порты 47500 и 47501). jar извлекает...

Muhammad Magdi Youssif / 10 мая 2018
0 голосов
0 ответов

У меня есть данные за 1 год 50 Гц (ветровая турбина), около 100 ГБ.Файлы 10 минут, каждый файл...

AMO / 10 мая 2018
0 голосов
1 ответ

У меня есть таблица с именем " транзакция " в Hive, которая разбита на столбец с именем "DS", в...

Prashanth G B / 09 мая 2018
0 голосов
1 ответ

Я новичок в больших данных и работал над небольшой задачей, где мне нужно объединить несколько...

user3829376 / 09 мая 2018
0 голосов
1 ответ

Есть ли способ обучить нелинейную SVC модель с использованием Pyspark ? Я пробовал: from sklearn

HAMZA MAJDI / 09 мая 2018
0 голосов
1 ответ

У меня большой список имен доменов, например: site.com ns1.site.com ns2.site.com test.main.site.com...

Joe Brew / 09 мая 2018
0 голосов
1 ответ

Я пытаюсь визуализировать 5-элементный набор данных с использованием PCA. Я использую и matlab, и R

Adnan Hossain / 08 мая 2018
0 голосов
1 ответ

У меня есть Google Analytics, интегрированный в Bigquery, и я пытаюсь написать запрос для выборки...

Awais Kazi / 08 мая 2018
0 голосов
1 ответ

Я весьма озадачен тем, что на этапах перемешивания и сортировки работа с m-мапперами и...

HungryBird / 08 мая 2018
0 голосов
0 ответов

У меня есть одна таблица, содержащая более 100 миллионов записей и 90 столбцов. Критерии поиска...

Khushal / 08 мая 2018
0 голосов
1 ответ

В apache spark разрешено загружать наборы данных из разных источников. Насколько я понимаю,...

Michocio / 08 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...