Я пытаюсь разбить текстовый столбец на фрейме данных и разбить верхние слова на строку / документ. У меня есть верхние слова, в этом примере это машина и обучение на счетчиках 8. Однако я не уверен, как разбить верхние слова на документ вместо целого кадра данных.
Ниже приведены результаты для ключевых слов для всего кадра данных:
машина 8
обучение 8
важно 2
думаю 1
значимый 1
import pandas as pd
y = ['machine learning. i think machine learning rather significant machine learning',
'most important aspect is machine learning. machine learning very important essential',
'i believe machine learning great, machine learning machine learning']
x = ['a','b','c']
practice = pd.DataFrame(data=y,index=x,columns=['text'])
То, что я ожидаю, находится рядом с текстовым столбцом, это еще один столбец, который указывает верхнее слово. Например, для слова «Машина» кадр данных должен выглядеть следующим образом:
a /… / 3
b /… / 2
c /… / 3