Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
0 ответов

Я запускаю синтаксический анализатор нейронных зависимостей из CoreNLP 3.8.0 с использованием...

Belphegor / 08 июня 2018
0 голосов
1 ответ

Я использую flintrock для запуска кластера Spark с 8 + 1 узлами на Amazon EC2. > flintrock...

clstaudt / 08 июня 2018
0 голосов
0 ответов

Вот моя проблема: У меня есть класс с некоторыми функциями для обработки nlp, а также я должен...

Junwen Xie / 08 июня 2018
0 голосов
1 ответ

В кластере EMR, используя java api, как скопировать файл из HDFS в локальную файловую систему узлов...

Rajesh Goel / 08 июня 2018
0 голосов
2 ответов

У меня есть некоторые данные, имитирующие следующую структуру: rdd = sc.parallelize( [ (0,1), (0,5)...

dandroid / 07 июня 2018
0 голосов
2 ответов

Я пытаюсь получить кластер Spark для чтения источников данных из облачного хранилища Amazon S3.Это...

clstaudt / 07 июня 2018
0 голосов
0 ответов

У меня есть следующий код Spark SQL: select f.typ_fact c case when month(f.dat_valid) in (1,2,3)...

Arnault / 07 июня 2018
0 голосов
1 ответ

Я пытаюсь использовать многопроцессорную обработку для чтения 100 CSV-файлов параллельно (и...

Paul Bendevis / 06 июня 2018
0 голосов
1 ответ

Я пытаюсь интегрировать apache spark с проектом весенней загрузки cassandra.Но при запуске проекта...

shivam gupta / 06 июня 2018
0 голосов
1 ответ

Я запускаю ./bin/pyspark at, чтобы открыть оболочку pyspark, но получаю следующую ошибку:

DT_NoHope / 06 июня 2018
0 голосов
0 ответов

Я не получаю данные в мое ведро s3 и не получаю никакой ошибки.Я работаю с Spark 2.3.0 и Python.По...

Eric Bellet / 06 июня 2018
0 голосов
1 ответ

Я обнаружил ошибку, когда сделал DataFrame из RDD. from pyspark.ml.fpm import FPGrowth sogou = sc

Chen / 06 июня 2018
0 голосов
1 ответ

У меня есть фрейм данных искры, как показано ниже: INPUT...

Curious one / 06 июня 2018
0 голосов
1 ответ

У меня есть фрейм данных, как показано ниже в pyspark. +---+-------------+----+ | id| device| val|...

User12345 / 05 июня 2018
0 голосов
0 ответов

Я знаю, что невозможно просто обновить таблицу MySQL с помощью Spark, но я пытался что-то избежать,...

Gaspar Avit Ferrero / 05 июня 2018
0 голосов
2 ответов

Я пытаюсь разбить каждый элемент JavaRDD на пробел, кроме части в кавычках и [].Я использую...

Amber / 05 июня 2018
0 голосов
1 ответ

У меня есть pyspark.mllib.linalg.SparseMatrix с 100k строк и 20M столбцов.Каков наилучший формат...

Ehsan Sadr / 05 июня 2018
0 голосов
1 ответ

Я хочу сделать некоторые вычисления для каждого текстового файла из каталога, а затем использовать...

pawelen / 05 июня 2018
0 голосов
0 ответов

Я могу прочитать файл json в фрейм данных в Pyspark, используя spark = SparkSession.builder

Leonius / 05 июня 2018
0 голосов
1 ответ

Я пытаюсь написать собственный получатель для Structured Streaming, который будет принимать...

ram / 04 июня 2018
0 голосов
2 ответов

Я использую Spark 1.5.3, я попытался разделить четные и нечетные столбцы в кадре данных spark,...

Mostwanted Mani / 04 июня 2018
0 голосов
1 ответ

Я использую spark 2.2 и java 1.8 образец XML-формата - <?xml version="1.0"...

Sekhar / 03 июня 2018
0 голосов
1 ответ

Я работаю над созданием модели LDA. Вот что я сделал до сих пор - создал униграмму и преобразовал...

lpt / 03 июня 2018
0 голосов
2 ответов

Пожалуйста, помогите мне здесь.Технический парень сказал мне, что Pentaho и Apache Spark работают...

Abdul Rahman / 02 июня 2018
0 голосов
1 ответ

Я получаю часть проверенных данных, например: from pyspark.sql.types import DateType import pyspark...

Leon / 02 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...