R: удаление строк на основе значения строки в столбце фрейма данных - PullRequest
2 голосов
/ 19 марта 2020

У меня есть фрейм данных a с именами строк. Имена строк - это уникальные имена строк, что-то вроде этого:

       order..new..i...2.ncol.new..i.....
J.TYMO                                620
J.TTMO                               2851
J.NTT                                1972
J.ABOT                                565
J.NNDO                               1025
J.SFTB                               2509

, когда я выполняю однострочный код as.data.frame(a[a[1] <= 2000]), чтобы удалить строки, меньшие или равные значению (как в 2000), мой результат делает не включать имена строк.

Я бы ОЖИДАЛ, что мой код сделает что-то вроде этого:

J.TYMO                                620
J.NTT                                1972
J.ABOT                                565
J.NNDO                               1025

Вместо этого он делает это:

1                                620
2                                1972
3                                565
4                                1025

Есть идеи? Спасибо.

Ответы [ 2 ]

3 голосов
/ 19 марта 2020

РЕДАКТИРОВАТЬ Я воспроизвел вашу ошибку, вам нужно добавить опцию drop = FALSE в ваше подмножество, чтобы получить data.frame как результат, а не вектор:

df_a <- structure(list(order..new..i...2.ncol.new..i..... = c(620L, 2851L, 1972L, 565L, 1025L, 2509L)), row.names = c("J.TYMO", "J.TTMO", "J.NTT", "J.ABOT", "J.NNDO", "J.SFTB"), class = "data.frame")
str(df_a)
#> 'data.frame':    6 obs. of  1 variable:
#>  $ order..new..i...2.ncol.new..i.....: int  620 2851 1972 565 1025 2509
names(df_a) <- "V1"

df_a[df_a[[1]] <= 1000 , , drop = FALSE]
#>         V1
#> J.TYMO 620
#> J.ABOT 565

СТАРЫЙ ОТВЕТ

Лучшим набором данных с названиями строк, хотя я и был, был набор данных mtcars. Основываясь на этом, я обнаружил, что добавление запятой в ваш вызов решает проблему:

dfr <- head(mtcars)
dfr
#>                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
#> Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
#> Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
#> Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
#> Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
#> Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
#> Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

as.data.frame(dfr[dfr[1]<20 , ])
#>                    mpg cyl disp  hp drat   wt  qsec vs am gear carb
#> Hornet Sportabout 18.7   8  360 175 3.15 3.44 17.02  0  0    3    2
#> Valiant           18.1   6  225 105 2.76 3.46 20.22  1  0    3    1

Таким образом с вашим специфическим a объектом, если это data.frame, ответ должен быть:

as.data.frame(a[a[1] <= 333 , ])
1 голос
/ 19 марта 2020

Вы извлекаете одну переменную как вектор и затем конвертируете этот вектор во фрейм данных. Вы должны просто использовать a[a[1] <= 333,] или subset(a, blah <= 333) для подмножества вашего фрейма данных. Пример:

a <- `row.names<-`(data.frame(blah = 332:335, bleh = "bleh"),
                   c("row1", "row2", "row3", "row4")
                   )

#### OUTPUT ####

     blah bleh
row1  332 bleh
row2  333 bleh
row3  334 bleh
row4  335 bleh

Теперь подмножество с a[a[1] <= 333,] или subset(a, blah <= 333):

     blah bleh
row1  332 bleh
row2  333 bleh

Если вы пытаетесь удалить строк меньше или равных значение (как в 333), тогда вы должны вместо этого использовать a[a[1] > 333,] или subset(a, blah > 333):

     blah bleh
row3  334 bleh
row4  335 bleh
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...