Вопросы с тегом bigdata - PullRequest

Вопросы с тегом bigdata

0 голосов
0 ответов

Я изучаю Map Reduce ... но у меня нет опыта работы с Python ... Я пытаюсь это: Суммировать...

Juan Manuel Ojeda / 21 мая 2018
0 голосов
0 ответов

У меня есть источники данных, которые предоставляют информацию о дате в формате ГГГГММ, например,...

user8708009 / 21 мая 2018
0 голосов
0 ответов

У меня есть проблема, когда я должен принять большой поток данных, где каждый элемент - это человек...

gotch4 / 21 мая 2018
0 голосов
1 ответ

Как я могу получить доступ к расширенным атрибутам файла или каталога HDFS в моем коде Java?Любые...

Abhay Dandekar / 21 мая 2018
0 голосов
0 ответов

Я использовал интерфейс командной строки для прямого запуска INSERT OVERWRITE LOCAL DIRECTORY...

Makubex / 20 мая 2018
0 голосов
0 ответов

Мы используем mongo (самодостаточный, а не управляемый сервис) в качестве хранилища данных, но наш...

polson136 / 19 мая 2018
0 голосов
0 ответов

Я получаю следующую ошибку, связанную с ошибкой ключа.У меня большой набор данных (в области 10...

StormsEdge / 18 мая 2018
0 голосов
1 ответ

Я нашел похожую тему: Понимание кэширования Spark но это все еще не точный мой вопрос.Давайте...

Michocio / 18 мая 2018
0 голосов
0 ответов

Я ищу библиотеку Java, способную обрабатывать большой набор данных наилучшим образом с точки зрения...

Jean-Pierre Coffe / 18 мая 2018
0 голосов
1 ответ

Я работаю в проекте с большим количеством таблиц, которые хранятся в HTML.В процессе очистки мне...

Pedro Coutinho / 18 мая 2018
0 голосов
1 ответ

Я пытаюсь понять, какое влияние может оказать кодирование стирания на чтение производительности...

samshers / 17 мая 2018
0 голосов
1 ответ

Я хочу отобразить первый день месяца для существующего столбца, например, 16.12.2008. Я хочу, чтобы...

Anil / 17 мая 2018
0 голосов
1 ответ

У меня есть простое приложение spark, которое читает данные csv и затем записывает их в avro. Это...

PPPP / 17 мая 2018
0 голосов
0 ответов

каждый раз, когда я перезагружал рой, у меня эта проблема java.io.IOException: Incompatible...

Atahualpa / 17 мая 2018
0 голосов
2 ответов

Как переименовать TABLE в запросе Big, используя StandardSQL или LegacySQL. Я пытаюсь с StandardSQL...

Dharmik Gadhiya / 17 мая 2018
0 голосов
1 ответ

Мое Java-приложение потребляет данные в реальном времени, а затем публикует их в файл ORC на S3 ....

DJ180 / 17 мая 2018
0 голосов
1 ответ

Я пытаюсь проверить действие оболочки oozie в моем cloudera vm (quickstart vm). При запуске...

PPPP / 16 мая 2018
0 голосов
0 ответов

У меня очень большая сеть, основанная на уникальных вершинах 100K и ребрах 500M (примечание: все...

km5041 / 16 мая 2018
0 голосов
0 ответов

Я пытаюсь загрузить файл, используя Pyspark, как показано ниже from pyspark.sql import SparkSession...

fraihat / 15 мая 2018
0 голосов
1 ответ

У меня есть 10gb CSV-файл с идентификаторами пользователей и полов, которые иногда дублируются....

Miha / 15 мая 2018
0 голосов
2 ответов

Я новичок в Spark & ​​Scala и получил исключение после вызова saveAsTextFile ().Надеюсь, что кто-то...

Nhan Tran / 15 мая 2018
0 голосов
1 ответ

Я читал о HBase, и общим описанием для него была «столбчатая база данных». Что это на самом деле...

Jeremiah Sanchez / 15 мая 2018
0 голосов
1 ответ

У меня есть экземпляр EC2, который открывает файл json, читает каждую строку и выполняет операцию...

WeCanBeFriends / 15 мая 2018
0 голосов
0 ответов

Везде говорится, что Spark и Flink должны заменить Hadoop MapReduce, потому что они лучше работают...

MacakM / 14 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...