Сокращение времени выполнения цикла for в Python - PullRequest
0 голосов
/ 25 сентября 2019

У меня есть список из 217 слов и около 95 тыс. Записей.Я пытаюсь перебрать список, а также фрейм данных, чтобы получить частоту записей, включая ключевые слова в списке.Итерации имеют очень большое число (217 * 95000).Цикл в основном выглядит следующим образом: (name_list - это список ключевых слов, а df_lower - это фрейм данных)

for i, item in enumerate(name_list):

match = df_lower.apply(lambda x: any(pd.Series(x).str.contains(name_list[i])))

true_match = df_lower[match]

count = true_match.count()

lst_dct = []

lst_dct.append({'Count':count, 'Firm':item})

df_final = df_final.append(lst_dct)

Когда я запускаю этот цикл, это занимает много времени, и мне не нужно видетьрезультатов пока нет.Как мне сократить время итерации?

...