Question

У меня есть список слов, и я хочу проверить, существуют ли они в столбце «текст» фрейма данных. Я написал регулярное выражение, и я хочу l oop регулярное выражение над столбцом и извлечь соответствующее слово, а затем удалить дубликаты, чтобы получить уникальные подходящие слова.

regex_list = []
for lex in deplex_fin:
    regex_list.append('/(^|\W)'+lex+'($|\W)/i')


matching_words_list = []
for regex in regex_list:
    matching_words_df = neg_sent['cleanText_emrm'].str.extract(regex)
    matching_words = list(matching_words_df.iloc[:,0])
    for item in matching_words:
        if str(item) != 'nan':
            matching_words_list.append(item)

Но это занимает слишком много времени - - Есть ли более быстрый способ сделать это?

l oop регулярное выражение для серии pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

l oop регулярное выражение для серии pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов