Вопросы с тегом bigdata - PullRequest

Вопросы с тегом bigdata

0 голосов
1 ответ

В моем кластере я определил local.cache.size до 10 ГБ, но я видел какой-то файл размером около 24...

Sahil / 03 октября 2018
0 голосов
3 ответов

У меня уже есть созданная таблица, и мне нужно вставить данные из файла CSV.

Mariana Araujo / 02 октября 2018
0 голосов
2 ответов

Я хочу передать фрейм данных, у которого есть набор значений, в новый запрос, но он не выполнен. 1)...

RushHour / 02 октября 2018
0 голосов
1 ответ

Я пытаюсь отфильтровать набор данных, получая только те строки, которые содержат слова в массиве.Я...

Hussain Asghar / 02 октября 2018
0 голосов
1 ответ

Попытка охватить проект, который включает в себя прием данных и аналитику, и может использовать...

Jake / 02 октября 2018
0 голосов
2 ответов

Я хочу напечатать данные сотрудников, которые присоединились до 1991 года. Ниже приведены мои...

RushHour / 02 октября 2018
0 голосов
3 ответов

Я хочу найти определенный тип данных шаблона в списке данных вместе с отсутствующими объектами

sk3145 / 02 октября 2018
0 голосов
1 ответ

Я выбираю столбцы из широкой строки со смещениями, как показано ниже df2 = df.select(...

user10438333 / 01 октября 2018
0 голосов
1 ответ

Я читаю текстовый файл фиксированной ширины как spark.read.text(//hdfs/abc.txt) Мне нужно извлечь...

user10438333 / 01 октября 2018
0 голосов
0 ответов

У меня есть FlinkKafkaConsumer11 с регулярным выражением.Он слушает существующие темы,...

thunder / 29 сентября 2018
0 голосов
1 ответ

Мои данные в консоли R выглядят так: dim (df1) [1] 54003 994 df1 [1:10, 1:10] marker X1 X73 X88 X9...

N Meriam / 28 сентября 2018
0 голосов
1 ответ

В чем разница между Архивация данных и Загрузка данных в перспективе больших данных или озера...

user957183 / 28 сентября 2018
0 голосов
2 ответов

Мой код выглядит следующим образом: val y = Seq(("100-200"),("300-400")...

user8167344 / 28 сентября 2018
0 голосов
1 ответ

У меня возникают проблемы, когда я сталкиваюсь с MySQL.У меня есть таблица deviceLog , в которой...

Arthur Liew / 28 сентября 2018
0 голосов
1 ответ

у меня есть следующий код в моем Jupyter: import pandas as pd import quandl df=quandl

sital sharma / 28 сентября 2018
0 голосов
0 ответов

Я тестирую Hive на Spark в качестве движка, но в то же время я хочу использовать Hast metastore для...

Edisnel C. C. / 28 сентября 2018
0 голосов
2 ответов

У меня есть огромные CSV-файлы размером ~ 15 ГБ в aws s3 (s3: //bucket1/rawFile.csv).Скажем, если...

bells / 27 сентября 2018
0 голосов
2 ответов

Я хочу выбрать несколько столбцов, добавить несколько столбцов или разделить, с некоторыми...

Katty / 27 сентября 2018
0 голосов
1 ответ

Мне нужно начать работать с некоторыми массивами данных, превышающими объем памяти, а это значит,...

Matt Camp / 27 сентября 2018
0 голосов
1 ответ

Я работаю над проектом, в котором я буду хранить каждый клик по определенному списку предметов

crellee / 27 сентября 2018
0 голосов
0 ответов

При загрузке данных Json в DataFrame я получаю только столбец _corrupt_record. Я пробовал Ниже оба...

user8167344 / 27 сентября 2018
0 голосов
2 ответов

У меня есть два набора массивов numpy: x1, y1 и x2, y2.Я хочу сохранить все значения x1 и y1,...

Ciaran / 26 сентября 2018
0 голосов
0 ответов
0 голосов
1 ответ

Я написал приложение MapReduce, которое работает на 6 узлах компьютеров.Я уверен, что мой алгоритм...

cdt / 25 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...