Вы можете использовать столбец text
в качестве нескольких функций, я бы порекомендовал вам разбить этот столбец ( Как разделить строку на несколько столбцов в кадре данных с пандами Python? ):
#first load dataframe (I assume it is excel format)
import pandas as pd
df = pd.read_excel('YourPath', header=True)
df['Text'].str.split('', expand=True)
затем вы можете преобразовать его в (0,1) фрейм данных:
df1 = (pd.get_dummies(df.set_index(['id', 'category']).stack())
.max(level=0)
.rename(columns=int)
.reset_index())
это приведет к чему-то вроде:
id category 5002 7400 ....
1 A 1 0 .....
2 B 0 1
, где столбцызначения из вашего фрейма данных и заполняются только в том случае, если значение существует в этой категории