Вопросы с тегом bigdata - PullRequest

Вопросы с тегом bigdata

0 голосов
1 ответ

Я ищу способ сортировки панд DataFrame.pd.DataFrame.sort_values не принимает ключевую функцию.Я...

Vasantha Ganesh K / 24 сентября 2018
0 голосов
0 ответов

Здравствуйте, ребята, мне нужна помощь в запросе больших данных с помощью mongodb 3.2, в котором...

khairul faiz / 23 сентября 2018
0 голосов
1 ответ

Я ищу datatore со следующими характеристиками. Я храню информацию об объектах Person Person может...

Sam Lee / 22 сентября 2018
0 голосов
2 ответов

Мне нужно отфильтровать только текст, начинающийся с> в столбце. Я знаю, что есть функции setsWith...

Hussain Asghar / 22 сентября 2018
0 голосов
0 ответов

Нужен совет.Я проиндексировал документы вasticsearch, теперь я хочу найти все результаты с одним...

Jamesjin / 22 сентября 2018
0 голосов
1 ответ

Итак, я имею дело с большим файлом данных, который содержит 1,3 миллиона строк.То, что я пытаюсь...

Alice / 21 сентября 2018
0 голосов
1 ответ

Я работаю с несколькими матрицами большого квадрата по 1.3e6 строк, и я хочу по диагонали их всех

LauC / 21 сентября 2018
0 голосов
0 ответов

Я пишу файлы Orc, используя формат MultipleOutputs, чтобы создать собственное имя файла.Я...

agarwal_achhnera / 21 сентября 2018
0 голосов
0 ответов

Согласно документации аккумуляторов в искре: Обратите внимание, что задачи на рабочих узлах не...

KayV / 20 сентября 2018
0 голосов
1 ответ

Согласно документации аккумуляторов: Обратите внимание, что задачи на рабочих узлах не могут...

KayV / 20 сентября 2018
0 голосов
1 ответ

У меня огромный набор данных из 292 миллионов строк (6 ГБ) в формате CSV.Функция Panda read_csv не...

Pushpendu Ghosh / 20 сентября 2018
0 голосов
1 ответ

DocumentAccess access = DocumentAccess.createDefault(); DocumentType type = access

Mohammad Sunny / 20 сентября 2018
0 голосов
1 ответ
0 голосов
1 ответ

код Python, который мне нужно преобразовать в PySpark, но я новичок в PySpark (SQL).Я пытаюсь...

Shail / 19 сентября 2018
0 голосов
2 ответов

Я использую потоковую искру и читаю потоки из Кафки.Прочитав этот поток, я добавляю его на карту...

masay / 19 сентября 2018
0 голосов
1 ответ

Я создал класс Searcher в своем приложении, в котором есть несколько документов.В классе Searcher я...

Mohammad Sunny / 19 сентября 2018
0 голосов
1 ответ

Я работаю над проектом глубокого обучения с около 700 ГБ табличных данных временных рядов в тысячах...

CephasW / 19 сентября 2018
0 голосов
1 ответ

Я хочу создать приложение в Vespa, которое извлекает данные из некоторых приложений и передает их в...

Mohammad Sunny / 19 сентября 2018
0 голосов
0 ответов

Это первый раз, когда я использую индексы, я не понимаю, зачем они нам нужны и как их внедрить в...

subas khanal / 19 сентября 2018
0 голосов
1 ответ

У меня очень большой массив данных для панд.Фрейм данных выглядит следующим образом: >> df...

KiwiFT / 18 сентября 2018
0 голосов
2 ответов

Я пытаюсь понять все, существует ли реальная разница между озером данных и большими данными, если...

user3342209 / 18 сентября 2018
0 голосов
0 ответов

Я пытаюсь суммировать движущиеся данные в пределах 4 диапазона.Мне нужно учитывать только M строка...

Walter / 18 сентября 2018
0 голосов
1 ответ

Я пытаюсь импортировать мой файл Excel в PySpark на компьютере Azure-DataBricks, который мне нужно...

Shail / 18 сентября 2018
0 голосов
1 ответ

Вот сценарий, который мы должны решить: Извлечь все файлы PDF с сервера. конвертировать PDF в PNG...

Elon Musk / 17 сентября 2018
0 голосов
0 ответов

Обратите внимание на мое специальное требование о передаче значения из задания Child Spark в...

TomG / 16 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...