Это можно сделать с помощью пакета mltools и data.table R. Сначала вам нужно преобразовать фрейм данных в data.table. Затем вы должны использовать функцию one_hot () из mltools. Вы можете увидеть пример, который я использовал с фиктивными данными.
# demo data frame
df <- data.frame(
org_name = c("A", "B", "C", "D", "E", "F"),
org_type = c("Tech", "Tech", "Business", "Business", "Bank", "Bank")
)
df
# load the libraries
library(data.table)
library(mltools)
# convert df to data.table
df_dt <- as.data.table(df)
# use one_hot specify the column name in cols
df_one_hot <- one_hot(df_dt, cols = "org_type")
df_one_hot
Вывод до:
org_name org_type
1 A Tech
2 B Tech
3 C Business
4 D Business
5 E Bank
6 F Bank
Вывод после:
org_name org_type_Bank org_type_Business org_type_Tech
1: A 0 0 1
2: B 0 0 1
3: C 0 1 0
4: D 0 1 0
5: E 1 0 0
6: F 1 0 0