Применение one_hot к строкам в кадре данных - PullRequest
0 голосов
/ 17 октября 2019

У меня есть фрейм данных, пятый столбец содержит текст, который я хочу применить к нему one_hot для дальнейшей обработки текста. поэтому я пробую приведенный ниже код, и он работает с отдельными строками, что дает мне целочисленное представление каждого слова в каждой ячейке. Мой вопрос: как я могу применить эту функцию ко всем строкам?

x1 = np.array(one_hot(combi.iloc[0,5],vocab_size)).reshape(-1,1)
x2 = np.array(one_hot(combi.iloc[1,5],vocab_size)).reshape(-1,1)

[[2961]
 [1955]
 [ 131]
 [2220]
 [   9]
 [2717]
 [3715]
 [3683]
 [4279]
 [1810]
 [2717]
 [2943]]
[[2612]
 [2155]
 [ 168]
 [3803]
 [ 219]
 [4435]
 [3905]
 [2867]
 [4052]
 [4555]
 [1487]
 [3515]
[4781]]
...