Вопросы с тегом РДД - PullRequest

Вопросы с тегом РДД

0 голосов
0 ответов

Я только что загрузил данные ratings из http://files.grouplens

joelun37 / 08 ноября 2019
0 голосов
1 ответ

Попытка вычислить оценки tf-idf для большого RDD документов, и всегда происходит сбой всякий раз,...

user6118986 / 07 ноября 2019
0 голосов
0 ответов

Я пытаюсь объединить данные двух файлов в один rdd. Допустим, у меня есть два файла file1.txt,...

Patel Jay / 07 ноября 2019
0 голосов
0 ответов

Я записываю эту команду на первый шаг: sepsiscategories

el abed houssem / 06 ноября 2019
1 голос
1 ответ

У меня есть файл ввода вершин, подобный этому: (1L,(0.5,0.5)) (2L,(0.25,0.0625)) (3L,(0.125,0.125))...

muhamad rifqi / 05 ноября 2019
0 голосов
1 ответ

Я использую hadoop 2.7.2, hbase 1.4.9, spark 2.2.0, scala 2.11.8 и java 1.8 . Я запускаю эту...

el abed houssem / 05 ноября 2019
0 голосов
0 ответов

Я создал общий XMLparser из lxml , используя etree.fromstring(x). Теперь мне нужно проанализировать...

onhamae / 05 ноября 2019
0 голосов
0 ответов

В python поддерживает ли apache spark RDD многоуровневые столбцы? Вот что я пытаюсь сделать: 1) У...

viks_python / 04 ноября 2019
0 голосов
1 ответ

Я установил пакет rdd, при вызове library(rdd) я получаю сообщение об ошибке: Ошибка: не найден...

Alexandra Lomakin / 04 ноября 2019
0 голосов
0 ответов

Вот моя конфигурация кластера : Главные узлы: 1 (16 ВЦП, 64 ГБ памяти) Рабочие узлы: 2 (всего 64...

Arjun / 03 ноября 2019
0 голосов
1 ответ

Я новичок в pyspark. Я пытался умножить два разреженных RDD. Код, который я пробовал, генерирует...

Zara / 02 ноября 2019
0 голосов
2 ответов

Я хочу посчитать процент каждого числа. rdd1=sc.parallelize([1,2,3,4,1,5,7,3]) Я попытался...

gcm / 02 ноября 2019
0 голосов
0 ответов

Я пытаюсь разбить паркет на несколько столбцов. Я делаю это, сначала создавая значения разделов с...

micah / 01 ноября 2019
0 голосов
2 ответов

Вариант использования - группировать по каждому столбцу в данном наборе данных и получать счетчик...

Patssay / 01 ноября 2019
0 голосов
1 ответ

Я хочу преобразовать строковые элементы в следующем СДР data0 = sc.parallelize( [('0',...

Samson / 01 ноября 2019
0 голосов
0 ответов

У меня есть два файла .csv. Файл 1: D,FNAME,MNAME,LNAME,GENDER,DOB,snapshot 2,66M,J,Rock,F,1995...

Samson / 31 октября 2019
0 голосов
1 ответ

Как определить тип данных для данных ниже, используя StructType в Spark Java...

user1326784 / 31 октября 2019
0 голосов
1 ответ

Spark материализует свои результаты на диске после случайного воспроизведения. Выполняя эксперимент...

Avinash Kumar / 29 октября 2019
1 голос
2 ответов

Я пытаюсь записать в текстовый файл после применения карты, сократить операции. Приведенный ниже...

Asari Ramprasad / 25 октября 2019
0 голосов
0 ответов

Я искал повсюду по этой проблеме, и даже наткнулся на этот пост ТАК без предоставленного решения...

Moose Sims / 25 октября 2019
0 голосов
1 ответ

Ввод: [['A', 'V1'], ['A', 'V2'], ['B',...

Kalyani Rane / 23 октября 2019
0 голосов
1 ответ

Я работаю над программой искры, которая по сути пытается объединить следующие две таблицы: Table1...

Barry / 21 октября 2019
0 голосов
0 ответов

Мне нужно периодически обрабатывать большие партии предметов в Spark. Элементы разделены ключом...

user1415913 / 21 октября 2019
0 голосов
2 ответов

Я выбираю все из таблицы и создаю из нее фрейм данных (df), используя Pyspark. Который разделен...

user3520791 / 19 октября 2019
2 голосов
1 ответ

У меня есть текстовый документ. Мне нужно найти возможное количество повторяющихся пар слов в общем...

sudeep / 19 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...