У меня есть датафрейм (df), который имеет два столбца [ID] и [from_data], и мне нужно искать значения строки в столбце [from_data] по нескольким ключевым словам.
Я могу найти одинключевое слово (пример 'лягушка'), где соотношение соответствует> 70, и выведите результаты, используя следующий фрагмент кода:
def get_ratio(row):
search_text = row['from_data']
return fuzz.token_set_ratio(search_text,'frog')
newdf = df[df.apply(get_ratio, axis=1) > 70]
К сожалению, я не могу понятькак адаптировать это для поиска нескольких ключевых слов (например, «лягушка», «барсук», «белка»).Также список ключевых слов, которые мне нужно искать, довольно обширный.
Я думал о добавлении значений в список, но не могу понять, как включить его в мой код (я довольноплохо знакомы с функциями).
В идеале я также хотел бы добавить дополнительный столбец, который отображает соотношение совпадений для каждой результирующей строки в моем новом фрейме данных (newdf).
Любая помощь будетс благодарностью.
Большое спасибо