У меня есть следующая таблица:
data = {'text': ['The scent is nice','I like the smell', 'The smell is awesome', 'I find the scent amazing', 'I love the smell']}
df = pd.DataFrame (data, columns = ['text'])
Я хочу перечислить все предложения, содержащие слово «запах»
word = 'smell'
selected_list = []
for i in range(0, len(df)):
if word in df.iloc[i,0]:
selected_list.append(df.iloc[i,0])
selected_list
Результат, который я получаю:
['I like the smell', 'The smell is awesome', 'I love the smell']
Однако я хочу перечислить также предложения, которые содержат слово, похожее на «запах», например «запах», и я хочу использовать предварительно обученное слово 2ve c Google и задать условие, если схожесть выше 0,5, также перечислить предложение. Следовательно, желаемый результат:
['The scent is nice', 'I like the smell', 'The smell is awesome', 'I find the scent amazing','I love the smell']
Как я могу добавить word2ve c в приведенный выше код, чтобы он сканировал не только "smell"
, но и все похожие слова?