Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
3 ответов

Имеется ли список строк, есть ли способ создать класс наблюдений или схему, не вводя строки вручную

mikeL / 02 мая 2018
0 голосов
1 ответ

Предположим, я выполнил команду pyspark и получил глобальную переменную spark типа SparkSession....

Michael / 02 мая 2018
0 голосов
0 ответов

Я пытаюсь выполнить SparkR gapply, по сути, когда я пытаюсь запустить это с моим входным файлом,...

and_apo / 02 мая 2018
0 голосов
0 ответов

Я получаю ошибку CDRS.toDF() Ошибка case class CDR(phone:String, first_type:String,in_out:String...

Atif Tariq / 02 мая 2018
0 голосов
2 ответов

Я пытаюсь вывести записи, используя следующий код: spark.createDataFrame(asRow, struct) .write

minyo / 02 мая 2018
0 голосов
0 ответов

Мы тестируем искры с Alluxio и Presto с Alluxio. Для оценки производительности мы взяли 5 разных...

Rijo Joseph / 02 мая 2018
0 голосов
1 ответ

У меня есть код для анализа файла журнала, используя map transformatio n. Затем RDD был...

skg / 02 мая 2018
0 голосов
2 ответов

Я столкнулся с технической проблемой, связанной с использованием Neo4j, которая на некоторое время...

Arlo Clarke / 02 мая 2018
0 голосов
0 ответов

Я искал различия между Spark и MapReduce, и все, что я действительно нашел, это то, что Spark...

Redcoatwright / 02 мая 2018
0 голосов
1 ответ

Мне нужно найти наиболее распространенное «необычное» слово в текстовом файле. У меня есть список...

Zach / 02 мая 2018
0 голосов
1 ответ

Я хочу загрузить определенный список файлов в Spark. Я сделал UDF, который фильтрует список файлов,...

Béatrice Moissinac / 02 мая 2018
0 голосов
1 ответ

У меня есть датафрейм с двумя уровнями вложенных полей root |-- request: struct (nullable = true) |...

Sindhu / 02 мая 2018
0 голосов
1 ответ

Я нашел программу JsonToCSV.scala в репозитории GitHub https://github.com/salamonpavel/jsonToCsv, и...

Miguel A. Friginal / 01 мая 2018
0 голосов
1 ответ

У меня есть два кадра данных df1 +---+---+----------+ | n|val| distances| +---+---+----------+ | 1|...

Maria / 01 мая 2018
0 голосов
1 ответ

У меня есть набор данных, в котором мне нужно получить некоторые данные, а также наиболее частые...

Tronald Dump / 01 мая 2018
0 голосов
2 ответов

Позвольте мне объяснить это на примере. Начиная со следующего кадра данных val df = Seq((1,...

Guanghua Shu / 01 мая 2018
0 голосов
0 ответов

У меня есть несколько терабайтных данных, и я хочу проанализировать их в Qt. В локальной системе...

morteza ali ahmadi / 01 мая 2018
0 голосов
1 ответ

Когда Spark использует программу записи Hadoop для записи файла части (используя saveAsTextFile ())...

kunrazor / 01 мая 2018
0 голосов
0 ответов

Я пытаюсь реализовать udf, который принимает входной Dataframe и имя столбца, каждая запись во...

marjun / 30 апреля 2018
0 голосов
1 ответ

Когда я запускаю искровое задание, написанное с помощью pyspark, у меня запускается jvm с...

Reut Sharabani / 30 апреля 2018
0 голосов
0 ответов

Я могу сохранять данные из spark в Mysql, но не в MongoDB и Mysql одновременно. Может кто-нибудь...

Rahul Anand / 30 апреля 2018
0 голосов
1 ответ

Я пишу искробезопасный код Scala, используя библиотеки CountVectorizerModel и MinHashLSH, чтобы...

Rajjat Dadwal / 30 апреля 2018
0 голосов
0 ответов

Эта строка отлично работала: val jobContent = tupleJobContent.filter(_._1 != null).map(_._1)...

Maxime Maillot / 30 апреля 2018
0 голосов
1 ответ

привет, я только начал изучать скалу. и просто следуйте инструкциям в udemy. Я следовал тому же...

Miguel A. Friginal / 30 апреля 2018
0 голосов
1 ответ

Мне нужна функция, которая будет принимать два файла в качестве входных данных и выводить наиболее...

zac s / 30 апреля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...