Добавьте значение нечеткого соотношения к фрейму данных и выполните поиск по нескольким ключевым словам. - PullRequest
0 голосов
/ 28 февраля 2019

У меня есть датафрейм (df), который имеет два столбца [ID] и [from_data], и мне нужно искать значения строки в столбце [from_data] по нескольким ключевым словам.

Я могу найти одинключевое слово (пример 'лягушка'), где соотношение соответствует> 70, и выведите результаты, используя следующий фрагмент кода:

def get_ratio(row):
   search_text = row['from_data']
   return fuzz.token_set_ratio(search_text,'frog')

newdf = df[df.apply(get_ratio, axis=1) > 70]

К сожалению, я не могу понятькак адаптировать это для поиска нескольких ключевых слов (например, «лягушка», «барсук», «белка»).Также список ключевых слов, которые мне нужно искать, довольно обширный.

Я думал о добавлении значений в список, но не могу понять, как включить его в мой код (я довольноплохо знакомы с функциями).

В идеале я также хотел бы добавить дополнительный столбец, который отображает соотношение совпадений для каждой результирующей строки в моем новом фрейме данных (newdf).

Любая помощь будетс благодарностью.

Большое спасибо

...