Как мы можем преобразовать данные вида
df <- structure(list(customer_number = c(3, 3, 1, 1, 3),
item = c("milkshake","burger", "apple", "burger", "water")
),
row.names = c(NA, -5L), class = "data.frame")
# customer_number item
# 1 3 milkshake
# 2 3 burger
# 3 1 apple
# 4 1 burger
# 5 3 water
в фиктивные переменные с числовым кодированием, например,
data.frame(customer_number=c(1,3),
item_milkshake=c(0,1),
item_burger=c(1,1),
item_apple=c(1,0),
item_water=c(0,1))
# customer_number item_milkshake item_burger item_apple item_water
# 1 1 0 1 1 0
# 2 3 1 1 0 1