Попытка поднабора данных в R - PullRequest
0 голосов
/ 19 сентября 2018

Я пытаюсь установить подкадр данных путем сравнения значений в двух столбцах.Я использую строку ниже

open <- open[open$AssignedGroup==open$Assigned.Group, ]

Это работало нормально, но не работало, когда некоторые значения в столбцах имеют больше символов. Например, я получил значение ниже в обоих столбцах для тех же строк, но выше сценарияневозможно установить подкадрABC DE Demo Integration E2E test 2

Может кто-нибудь помочь мне узнать, в чем здесь проблема?

Вставка первых 10 строк для справки

Num AssignedGroup   Priority    Assigned.Group
1   ABC DE Demo Integration E2E test 2  Medium  ABC DE Demo Integration E2E test 2
1   ABC DE Demo Integration E2E test 2  Medium  Group 1
1   ABC DE Demo Integration E2E test 2  Medium  Group 2
2   ABC DE Demo Integration E2E test 2  High    ABC DE Demo Integration E2E test 2
2   ABC DE Demo Integration E2E test 2  High    Group 1
2   ABC DE Demo Integration E2E test 2  High    Group 2
3   ABC DE Demo Integration E2E test 2  Low ABC DE Demo Integration E2E test 2
3   ABC DE Demo Integration E2E test 2  Low Group 1
3   ABC DE Demo Integration E2E test 2  Low Group 2
4   ABC DE Demo Integration E2E test 2  Low ABC DE Demo Integration E2E test 2

Я вставилструктура данных для справки

'data.frame':   82710 obs. of  4 variables:
 $ Num           : chr  "INC0615378" "INC0615378" "INC0615378" "INC0615495" ...
 $ AssignedGroup : chr  "ABC DE Demo Integration E2E test 2" "ABC DE Demo Integration E2E test 2" "ABC DE Demo Integration E2E test 2" "ABC DE Demo Integration E2E test 2" ...
 $ Priority      : chr  "Medium" "Medium" "Medium" "Medium" ...
 $ Assigned.Group: chr  "ABC DE Demo Integration E2E test 2" "GROUP 1" "Group 2" "ABC DE Demo Integration E2E test 2" ...

1 Ответ

0 голосов
/ 19 сентября 2018

у меня работает:

 Num<-c(1,1,1,2,2,2,3,3,3,4)
 AssignedGroup<-rep("ABC DE Demo Integration E2E test 2",10)
 Assigned.Group<-c("ABC DE Demo Integration E2E test 2","Group 1",
 "Group 2","ABC DE    Demo Integration E2E test 2","Group 1",
 "Group 2","ABC DE Demo Integration E2E test 2","Group 1",
 "Group 2","ABC DE Demo Integration E2E test 2")
 Priority<-c(rep("Medium",3),rep("High",3),rep("Low",4))
 df<- as.data.frame(cbind(Num,AssignedGroup,Priority,Assigned.Group))
 library(data.table)
 dfSubset<-df[which(df$Assigned.Group %like% df$AssignedGroup), ]
 dfSubset
#   Num           AssignedGroup             Priority              Assigned.Group
 #1    1 ABC DE Demo Integration E2E test 2   Medium ABC DE Demo Integration E2E test 2
 #4    2 ABC DE Demo Integration E2E test 2     High ABC DE Demo Integration E2E test 2
 #7    3 ABC DE Demo Integration E2E test 2      Low ABC DE Demo Integration E2E test 2
 #10   4 ABC DE Demo Integration E2E test 2      Low ABC DE Demo Integration E2E test 2
...