Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
0 ответов

Я использую newAPIHadoopRDD для чтения всех данных из HBase.Это неэффективно, так как я читаю все...

Ani / 27 сентября 2019
0 голосов
2 ответов

Я хочу написать Spark Dataframe в формате Parquet.snappy в HDFS.В настоящее время он создает по...

sumeet agrawal / 26 сентября 2019
1 голос
1 ответ

Я пытаюсь сгладить данные в СДР.СДР структурирован как список из 4-х кортежей с первым элементом -...

algorythms / 25 сентября 2019
0 голосов
1 ответ

Я новичок в spark / scala.У меня есть созданный ниже RDD путем загрузки данных из нескольких путей

Vishvajit / 24 сентября 2019
0 голосов
1 ответ

У меня есть несколько rdd и я хочу получить общие слова, присоединившись к нему, и получить...

Ricky / 24 сентября 2019
0 голосов
0 ответов

С учетом СДР и функции, которые принимают два аргумента и возвращают их слияние (например).Я хотел...

jack / 23 сентября 2019
1 голос
2 ответов

У меня есть копия данных RDD из следующего файла, я хочу объединить строки на основе разделителя...

Jason Zhou / 23 сентября 2019
0 голосов
1 ответ

У меня есть данные, как показано ниже, и мне нужно отделить их на основе "," I/p file : 1,2,4...

Michel / 20 сентября 2019
0 голосов
1 ответ

Каждое значение в моем rdd является кортежем: temp = clustering.map(lambda x: (x[0][0], (1,1)))...

Shane / 19 сентября 2019
0 голосов
1 ответ
1 голос
0 ответов

Я хочу получить нулевые поля от df до моего json и при этом использовал метод na.fill, чтобы...

Sanyam Jain / 11 июля 2019
0 голосов
0 ответов
1 голос
1 ответ

Я заархивировал три RDD и в результате получил вложенную структуру. val rdd1 = sc

samba / 10 июля 2019
0 голосов
1 ответ

У меня есть использованный фрейм данных, который содержит запрос df : Dataframe =spark

Rahul Rawat / 10 июля 2019
0 голосов
1 ответ

У меня есть два списка IP-адресов, которые расположены в отдельных текстовых файлах. Я хочу...

Yousef / 08 июля 2019
0 голосов
1 ответ

Привет всем, поэтому я начал изучать архитектуру Apache Spark и понимаю, как работает поток данных...

Maher Marwani / 07 июля 2019
0 голосов
1 ответ
0 голосов
1 ответ

У меня есть требование прочитать изображение из HDFS, выполнить некоторую обработку и сохранить...

hemshankar sahu / 04 июля 2019
0 голосов
0 ответов

SubjectMarks -> Table SubjectName String, Marks Integer, ModifieDate Date PK: SubjectName, CK:...

Raghu / 04 июля 2019
1 голос
1 ответ

Я использую стандартный пакет rdrobust от Calonico и соавторов для получения оценок RD и графиков в...

MCS / 04 июля 2019
3 голосов
0 ответов

Я новичок в Apache Spark. Я пытаюсь обработать набор видео для Apache Spark для видеоаналитики....

Raja Ayaz / 04 июля 2019
0 голосов
2 ответов
0 голосов
2 ответов

У меня есть путь к CSV, с которого я хотел бы прочитать.Этот CSV включает в себя три столбца: «тема...

jjaguirre394 / 03 июля 2019
0 голосов
0 ответов

У меня есть RDD, который содержит около 15 столбцов.Я хочу создать RDD с 8 столбцами.все 8 столбцов...

kranthi kumar / 02 июля 2019
0 голосов
0 ответов

Я хочу установить контрольные точки внутри foreach через равные промежутки времени в ядре Spark....

Aman / 01 июля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...