Как заменить определенные значения в определенных строках и столбцах с NA в R? - PullRequest
0 голосов
/ 10 февраля 2019

В моем фрейме данных я хочу заменить определенные пустые ячейки и ячейки значениями на NA.Но ячейки, которые я хочу заменить на NA, не имеют ничего общего со значением, которое хранит ячейка, но с комбинацией строки и столбца, в которых они хранятся.

Вот пример фрейма данных DF:

  Fruits   Price   Weight   Number of pieces

  Apples      20      2          10
  Oranges     15      4          16
  Pineapple   40      8           6
  Avocado     60      5          20

Хочу заменить вес Pineapple'e на NA, а количество штук Orange на NA.

DF$Weight[3] <- NA
DF$`Number of pieces`[2] <- NA  

Это заменяет любое значение, которое хранится в этой позиции и может измениться.Я хочу использовать определенные имена строк и столбцов, чтобы сделать эту замену, чтобы положение значения стало неактуальным.

Вывод:

 Fruits   Price   Weight   Number of pieces

  Apples      20      2          10
  Oranges     15      4          NA
  Pineapple   40      NA           6
  Avocado     60      5          20

Но если порядок таблицы изменится, это заменит неверные значения на NA.

Как мне это сделать?

Ответы [ 3 ]

0 голосов
/ 10 февраля 2019
library(dplyr)
df %>% 
  mutate(Weight=ifelse(Fruits=="Pineapple",NA,Weight),
         Number=ifelse(Fruits=="Oranges",NA,Number))#use Number of Pieces

Результат: Количество частей было усечено до числа из-за чтения данных.

     Fruits Price Weight Number
1    Apples    20      2     10
2   Oranges    15      4     NA
3 Pineapple    40     NA      6
4   Avocado    60      5     20
0 голосов
/ 10 февраля 2019

Вот способ использования функции is.na<-.

is.na(DF$Weight) <- DF$Fruits == "Pineapple"
is.na(DF$`Number of pieces`) <- DF$Fruits == "Oranges"

DF
#     Fruits Price Weight Number of pieces
#1    Apples    20      2               10
#2   Oranges    15      4               NA
#3 Pineapple    40     NA                6
#4   Avocado    60      5               20

Данные в формате dput.

DF <-
structure(list(Fruits = structure(c(1L, 3L, 4L, 2L), 
.Label = c("Apples", "Avocado", "Oranges", "Pineapple"), 
class = "factor"), Price = c(20L, 15L, 40L, 60L), 
Weight = c(2L, 4L, 8L, 5L), `Number of pieces` = c(10L, 
16L, 6L, 20L)), class = "data.frame", row.names = c(NA, -4L))
0 голосов
/ 10 февраля 2019

Поскольку ваша структура данных является двухмерной, вы можете сначала найти индексы строк, содержащих определенное значение, и использовать эту информацию.

which(DF$Fruits == "Pineapple")
[1]  3
DF$Weight[which(DF$Fruits == "Pineapple")] <- NA

Вы должны знать, что which вернет вектор, так что если у вас есть несколько фруктов под названием «Ананас», то предыдущая команда вернет все их индексы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...