Вопросы с тегом bigdata

0 голосов

0 ответов

python - вычисление взвешенной центральности между узлами огромного графа

У меня есть огромный график (например, 300 000 узлов и 1 000 000 ребер), который я анализирую с...

Forinstance / 29 октября 2018

0 голосов

1 ответ

Хранение данных временных рядов: СУБД против NoSQL

В эти дни я сталкиваюсь с проблемой хранения данных временных рядов. Эти данные взяты с...

LucaF / 29 октября 2018

0 голосов

0 ответов

python - Упрощение большого файла Pajek .net

У меня есть огромный сетевой файл Pajek (около 2 ГБ) и виртуальная машина Ubuntu с 32 ГБ ОЗУ....

Forinstance / 29 октября 2018

0 голосов

1 ответ

Hadoop 3.1.1 и т. Д. И sbin-файлы

Я пытаюсь настроить Hadoop 3.1.1 на Mac. Любой совет, какие файлы мне нужно редактировать внутри...

Hatim TM / 29 октября 2018

0 голосов

1 ответ

Лямбда-архитектура на AWS: выберите базу данных для пакетного уровня

Мы строим архитектуру Lambda на стеке AWS. Отсутствие DevOps вынуждает нас отдавать предпочтение...

VB_ / 29 октября 2018

0 голосов

2 ответов

Pandas CSV Reader: время чтения увеличивается со скипроу

Я работаю с большим набором последовательных данных, длина которых может отличаться. В настоящее...

user10300706 / 27 октября 2018

0 голосов

0 ответов

Spark, HIVE;Вопрос о системной раздаче 2 ТБ в день

Моя команда должна создать базу данных HIVE для обработки и доступа к очень большому количеству...

notilas / 27 октября 2018

0 голосов

0 ответов

Как настроить многоузловой кластер GridDB на AWS?

Я пытаюсь создать кластер GridDB с 5 узлами, но я не знаю, как это сделать.В настоящее время я...

Gopheritis / 27 октября 2018

0 голосов

0 ответов

лучший способ интеграции внешних API в Hadoop

Мы используем hive over hdfs для автоматизации нашей системы отчетности. Наш импорт в HDFS из...

Simran kaur / 26 октября 2018

0 голосов

1 ответ

MySQL INSERT ... ВЫБРАТЬ большой набор данных из 420 миллионов записей

У меня большой набор данных приблизительно из 420 миллионов записей, и я смог загрузить их во...

Adam / 26 октября 2018

0 голосов

0 ответов

Реализация устаревших синхронных параллелей

Есть ли способ реализовать устаревшую синхронную параллель в тензорном потоке.Любая помощь будет...

Souvik Karmakar / 25 октября 2018

0 голосов

1 ответ

Результаты Spark доступны через API

Мы действительно хотим получить информацию о том, как результаты Spark Query будут доступны для...

intiha / 25 октября 2018

0 голосов

0 ответов

Может ли кто-нибудь предложить онлайн-консоль для практики больших данных программы

Я хочу попрактиковаться в больших данных.Я не могу установить его на свой ноутбук, потому что это...

muniya / 25 октября 2018

0 голосов

1 ответ

Преобразование .txt Spark Выходных данных в .csv

В настоящее время я получаю вывод из задания spark в файле .txt.Я пытаюсь преобразовать его в .csv

Rishabh / 25 октября 2018

0 голосов

0 ответов

Объединение двух ключей в одном наборе данных с помощью Hadoop Mapreduce

Я новичок в Hadoop и пытаюсь запустить задание mapupduce hadoop в Java, чтобы объединить некоторые...

arjunj / 24 октября 2018

0 голосов

1 ответ

Использование больших данных Tensorflow

Предположим, у меня есть огромный список объектов, каждый из которых может быть, например, списком...

user1786577 / 24 октября 2018

0 голосов

2 ответов

Чтение CSV-файла, цикл по строкам, использование соединений

Итак, у меня есть большой файл CSV Excel, который мой компьютер не может обработать открытие без...

chocolatekeyboard / 24 октября 2018

0 голосов

0 ответов

Добавить в файл паркета с помощью Parquet.NET

Я создал веб-сканер в рамках своей диссертации.Это выполняется каждую минуту и получает данные -...

HakuHUN / 24 октября 2018

0 голосов

1 ответ

Informatica тип данных строки BDM

Я использую мой картографический двигатель, и мой целевой стол hive является транснациональным.У...

Psp0108 / 23 октября 2018

0 голосов

1 ответ

Объединить несколько больших фреймов данных в DASK

У меня есть несколько (~ 50) больших (~ 1 до 5 ГБ каждый) CSV-файлов, которые я хотел бы объединить...

user2969402 / 22 октября 2018

0 голосов

1 ответ

Максимальное количество разделов в улье

В моих таблицах кустов 1500 разделов, но выполнение запроса занимает больше времени, чем ожидалось

Naveen Gupta / 22 октября 2018

0 голосов

1 ответ

Что означают «другие регионы» в веб-интерфейсе hbase?

Я объединил некоторые области таблицы в моем кластере, исключений не было.После этого я обнаружил в...

A.Chinese / 22 октября 2018

0 голосов

4 ответов

проверить, если значение в кортеже dataframe

У меня огромный массив данных (38 миллионов строк): df = pd.DataFrame({'I':[1,2,3,4],...

Ward / 22 октября 2018

0 голосов

0 ответов

сервер spark thrift - должна ли куча памяти быть больше, чем общая память исполнителя?

Должна ли кучная память (xmx на ps) всегда быть больше, чем память исполнителя / драйвера для...

toop / 22 октября 2018

0 голосов

3 ответов

PHP: чтение и экспорт больших данных без изменения memory_limit & max_execution_time

У меня есть много данных для экспорта в CSV-файл.Моя функция зацикливается в каждом поле и...

prozbk / 22 октября 2018