Мне нужно создать фрейм данных из цикла. Идея состоит в том, что цикл будет читать фрейм данных текстов (train_vs) и искать конкретные ключевые слова ['rule', 'data'], а затем вычислять их частоту или TF. то, что я хочу, это результат двух столбцов с TF слов для каждого текста внутри них. код, который я использую, следующий:
d = pd.DataFrame()
key = ['govern', 'data']
for k in key:
for w in range(0, len(train_vs)):
wordcount = Counter(train_vs['doc_text'].iloc[w])
a_vs = (wordcount[k]/len(train_v.iloc[w])*1)
temp = pd.DataFrame([{k: a_vs}] )
d = pd.concat([d, temp])
однако, я получаю два столбца, но со значениями для первого ключевого слова и nan для второго для всего столбца текстов, а затем nan для первого и значения для второго снова для всего столбца текстов. таким образом, число строк в итоговом фрейме данных удваивается.
Я хочу, чтобы оба значения были рядом друг с другом.
Ваша помощь высоко ценится.
Благодарю.