Как отобразить один столбец данных в другой столбец в Apache Spark Scala? - PullRequest
0 голосов
/ 11 мая 2018

Я создал фрейм данных из файла CSV. Он имеет 10 столбцов, две из которых - актриса и название фильма. Я хочу сделать актрису ключом, а название - ценностью, а затем хочу уменьшить ее ключ, чтобы получить список фильмов для каждой актрисы. В этом случае я должен сначала сопоставить столбец актрисы с заголовком фильма. Итак, как получить кортежи актрисы, пары «ключ-значение» в «Spark scala». Кроме того, я хочу сделать это с использованием основных операций, а не SparkSQL.

1 Ответ

0 голосов
/ 11 мая 2018

Предложение: Низкое качество вопроса, вы должны сначала найти примеры в Интернете, а затем

val df = ???

val moviesByActressDF = df.groupBy("actress_col")
.agg(collect_list("movie_col"))

Надеюсь, это поможет, ура

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...