Допустим, у меня большой массив данных в R с номерами позиций и брендами.
У каждой марки может быть несколько номеров товаров, при этом у номеров товаров может быть только один соответствующий номер марки.
Существует ли быстрый способ вычисления и замены отсутствующих записей бренда (значений NA), как указано ниже, при этом значения NA остаются там, где невозможно найти точную замену.
trainset <- data.frame("brand" = c(1,2,3,NA,NA,NA,2,NA,2,NA,NA,NA,NA,NA), "item" = c(50, 100, 300,200,100,100,100,50,200,300,100,50,200,900)
trainset
trainsetresult <- <- data.frame("brand" = c(1, 2, 3, 2, 2, 2, 2, 1, 2, 3, 2, 1, 2, NA), "item" = c(50, 100, 300,200,100,100,100,50,200,300,100,50,200,900)
trainsetresult
trainset
trainsetresult
Дополнительная информация: номера элементов, а также номера брендов превышают пару сотен в кадре данных, над которым я работаю.
Заранее спасибо!