У меня есть список слов, и я хочу проверить, существуют ли они в столбце «текст» фрейма данных. Я написал регулярное выражение, и я хочу l oop регулярное выражение над столбцом и извлечь соответствующее слово, а затем удалить дубликаты, чтобы получить уникальные подходящие слова.
regex_list = []
for lex in deplex_fin:
regex_list.append('/(^|\W)'+lex+'($|\W)/i')
matching_words_list = []
for regex in regex_list:
matching_words_df = neg_sent['cleanText_emrm'].str.extract(regex)
matching_words = list(matching_words_df.iloc[:,0])
for item in matching_words:
if str(item) != 'nan':
matching_words_list.append(item)
Но это занимает слишком много времени - - Есть ли более быстрый способ сделать это?