Я хотел бы иметь функцию, которая открывает файл sequenceFile и предоставляет путь к файлу,...
Я создал фрейм данных из файла CSV. Он имеет 10 столбцов, две из которых - актриса и название...
Скажем, у меня есть Spark SQL DataFrame, например: name gender grade ----------------- Joe M 3 Sue...
Я использую Spark 1.6.2 в Google Cloud Dataproc (поэтому Dataproc версия 1.0). Мой кластер состоит...
Я использую snappydata-1.0.1 на HDP2.6.2, spark 2.1.1 и смог подключиться из внешнего искрового...
Я одобряю этот пример машинного обучения Apache , чтобы создать систему рекомендаций для наших...
Как сохранить Theta Sketch (Yahoo) в таблице SnappyData вместо записи в файл?Потому что я создаю...
Я пытаюсь обновить основную таблицу (HBASE) только для 1 столбца, но происходит то, что все...
Я хочу развернуть и отправить программу spark, используя sbt, но с ее ошибкой. Код: package in.goai
просто изучите искру на некоторое время found я нашел api: saveAsNewAPIHadoopDataset, когда я...
Не удается запустить Spark. Мы используем Cloudera CDH 5.14.2 с Java 1.8.0_91. Мы не уверены, какие...
У меня есть код Scala для вычисления нового столбца с использованием функции withcolumn в моем...
PRODUCT_ID_FETR_MAP из df имеет тип карты (ключ: Int, значение: struct). Я хочу преобразовать этот...
Я использую Spring Framework для создания API для запроса некоторых из моих таблиц в Hadoop.Я...
Я использую RDD [LabeledPoint] в своем коде. Но теперь я должен нормализовать данные, используя...
Я записываю свои данные в Kibana из Spark, создав карту.Мой тип данных List[Seq[String]].Но вместо...
org.apache.spark.SparkException: задание прервано из-за сбоя этапа: сбой задачи 0 на этапе 2.0 4...
Когда это происходило, я использовал газированную воду. Эта моя версия полностью соответствует...
Я обрабатываю некоторые журналы, я использую logstash, чтобы прочитать журналы из файлов журналов и...
код выглядит следующим образом: val tokenizer = new RegexTokenizer()
Я использую приближение сходства, чтобы найти сходство Жакара между двумя наборами. val dfA =...
У меня есть кадр данных в pyspark, как показано ниже. df.show() +---+-------+----+ | id| type|s_id|...
Я настроил рабочий процесс для выполнения задания на искру. Кажется, что рабочий процесс при...
Я использую официальную Рекомендацию в качестве теста. Я сделал эти шаги успешно: сервер событий...
Я пробую разъем spark-neo4j . В примерах этой ссылки я нашел следующую строку: neo