У меня есть набор данных для фабрики, производящей золотые и серебряные изделия (ручка), мы хотели бы проверить качество, назначив сотрудников для проверки этих изделий, произведенных на всех станках на фабрике. Ниже приведены примеры данных:
Каждый компьютер находится в определенной комнате / секции / здании, и у нас есть два столбца для группировки идентификаторов сотрудников, которые тестируют золотые и серебряные ручки.
Проблема в том, что у меня есть дубликаты сотрудников, проверяющих качество той же машины. Поэтому я хотел бы удалить эти дубликаты и сгруппировать те, которые не являются дубликатами. Образец:
Bld.No <- c(1,1,1,1,1,1,2,2,2,2)
Section <- c("A","A","A","A","B","B","C","C","D","D")
Room.No <- c(100,100,100,100,200,200,300,300,400,400)
Gold <- c(8,6,4,0,6,0,7,2,2,1)
Silver <- c(1,0,0,1,2,3,4,0,4,0)
Total <- c(9,6,4,1,8,3,11,2,6,1)
Emp.Gold.ID <- c("A11, A09, B22, E12, A04, C09, D33, A01", "A11, A09, B22, E12, A04, A01", "A09, 822, E12, A04", NA, "A71, A09, B12, E32, A04, C19", NA, "B22, E12, A04, C09, D33, A01, M11", "E12, Z09", "C09, D33", "D18")
Emp.Silver.ID <- c("A17", NA, NA, "D33", "B22, E12", "A09, B12, E32", "A44, C02, D03, A71", NA, "A12, A01, M11, D18", NA)
df <- data.frame(Bld.No, Section, Room.No, Gold, Silver, Total, Emp.Gold.ID, Emp.Silver.ID)
Примечание: если emp.Id уже есть в предыдущих записях, будь то золото или серебро, мы должны удалить его. Значение ID должно быть в любом из них и удалить дубликаты. Посмотрите пример последней записи в таблице сэмплов и выходных данных, мы удалили последнюю запись (2, D, 400, 1, 0, 1, D18, NA), потому что D18 уже находится в предыдущей записи, даже если онав серебряной колонне.
Данные выборки и выходные данные:
Данные выборки и выходные данные