У меня большой набор данных, который содержит много информации о времени отправления автобусных остановок. У меня есть основной набор данных, который содержит информацию о Trip_ID, Bus_sign, а также stop_ID. Кроме того, у меня есть индекс, по которому я хотел бы отфильтровать df по.
df <- data.frame(c(10,10,10,10,10,10,10,10,10,10),
c(8,10,12,15,22,26,27,40,45,50),
c("0000001","0000002","0000003","0000004","0000005","0000006","0000007", "0000008","0000009","0000010"))
names <- c("trip_ID", "Bus_sign", "stop_ID")
colnames(df) <- names
index <- c("0000001", "0000002", "0000003", "0000011","00000013")
фрейм данных будет выглядеть примерно так
trip_ID Bus_sign stop_ID
1 10 8 0000001
2 10 10 0000002
3 10 12 0000003
4 10 15 0000004
5 10 22 0000005
6 10 26 0000006
7 10 27 0000007
8 10 40 0000008
9 10 45 0000009
10 10 50 0000010
индекс содержит некоторые идентификаторы stop_ID внутри df, однако он также содержит некоторые из них, которые отсутствуют в df. Я хотел бы отфильтровать совпадения индекса и df для df $ stop_ID.
результат должен выглядеть следующим образом:
trip_ID Bus_sign stop_ID
1 10 8 0000001
2 10 10 0000002
3 10 12 0000003
Я пробовал функцию подмножества, однако это не будет работа
subset(df, stop_ID %in% index)