Как использовать «sparklyr :: replace.na ()» для замены NaN в одном столбце? - PullRequest
0 голосов
/ 15 мая 2019

Я использую sparklyr для взаимодействия с искрой.Я пытаюсь заменить значения NaN только в одном столбце.

Можно ли использовать функцию sparklyr replace.na(), но применять ее только к одному столбцу?Я проверил документацию, но она мне не помогла.

Этот вопрос похож, но ответ изменяет все значения NaN во всем фрейме данных.

1 Ответ

1 голос
/ 23 мая 2019

Похоже, что вы действительно должны указать столбец при использовании sparklyr::na.replace(). Смотри https://github.com/rstudio/sparklyr/issues/127#issuecomment-236318033.

Пример:

temp <- tibble(
  a = c(1, 2, NA),
  b = c("A", NA, "B")
)

temp_spark <- sdf_copy_to(sc, temp, "temp_spark")

temp_spark %>%
  na.replace()
#  a  | b
#  1  | A
#  2  | NA
# NaN | B

temp_spark %>%
  na.replace(a = 0)
# a | b
# 1 | A
# 2 | NA
# 0 | B

...