Как заменить значение на NAN в кадре искровых данных (проблема заключается в парализации) - PullRequest
0 голосов
/ 04 января 2019

Задача: Пусть df будет фреймом данных искры. Мы хотим заменить значение n в df на NA.

В R я бы просто написал

df[df==n] <- NA

Проблемы / вопросы: (поскольку я новичок в Spark, любые комментарии приветствуются)

  • Что в SparkR эквивалентно NA? Я нашел такие функции, как isNull и isNAN, и я запутался, если есть некоторые различия.

Я смог сделать это в одном столбце col1, используя ifelse, т.е.

df[[col1]] <- ifelse( df[[col1]] == n, NA, df[[x]])

но я не смог "парализовать" его.

Я пытался:

df <- spark.lapply(colnamed(df), function(x) {ifelse(df[[x]] == n, NA , df[[x]])})

но я получил сообщение

Задание прервано из-за сбоя этапа

которого я не понимаю.

1 Ответ

0 голосов
/ 04 января 2019
...