У меня есть 2 кадра данных, содержащих текст в виде списка в каждой строке.Этот называется df
Datum File File_type Text
Datum
2000-01-27 2000-01-27 0864820040_000127_04.txt _04 [business, date, jan, heineken, starts, integr..
, и у меня есть еще один, df_lm, который выглядит так:
List_type Words
0 LM_cnstrain. [abide, abiding, bound, bounded, commit, commi...
1 LM_litigius. [abovementioned, abrogate, abrogated, abrogate...
2 LM_modal_me. [can, frequently, generally, likely, often, ou...
3 LM_modal_st. [always, best, clearly, definitely, definitive...
4 LM_modal_wk. [almost, apparently, appeared, appearing, appe...
Я хочу создать новые столбцы в df, где совпадение слов должно бытьподсчитано, например, сколько слов из df_lm.Words [0] в df.Text [0]
. Примечание: df имеет около 500 строк, а df_lm имеет 6 ->, поэтому мне нужно создать 6 новыхстолбцы в df, чтобы обновленный df выглядел примерно так:
Datum ...LM_cnstrain LM_litigius Lm_modal_me ...
2000-01-27 ... 5 3 4
2000-02-25 ... 7 1 0
Надеюсь, я ясно понял вопросЗаранее спасибо!
РЕДАКТИРОВАТЬ: я уже сделал что-то.аналогично, создав список и зацикливая его, но поскольку списки в df_lm очень длинные, это не вариант.
Код выглядел так:
result_list[]
for file in file_list:
count_growth = 0
for word in text.split ():
if word in growth:
count_growth = count_growth +1
a={'Grwoth':count_growth}
result_list.append(a)