Вот мой набор данных
No Description
1 Paying Google ads
2 Purchasing Facebook Ads
3 Purchasing Ads
4 AirBnB repayment
У меня есть txt
файлы с именем entity.txt
0, Google
1, Facebook
2, Ads
Мне нужно обнаружить все ключевые слова на entity.txt
в моем фрейме данных либотолько одно или несколько ключевых слов, и если ни одно ключевое слово не обнаружено, мы называем это Other
, поэтому мое ожидание вывода:
No Description Keyword
1 Paying Google ads Google
2 Purchasing Facebook Ads Facebook Ads
3 Purchasing LinkedIn Ads LinkedIn Ads
4 AirBnB repayment Other
Вот что я сделал
with open('entity.txt') as f:
content = f.readlines()
content = [x.strip() for x in content ]
df['keyword'] = df['description'].apply(lambda x: ' '.join([i for i in content if i in x]))
df['keyword'] = df['keyword'].replace('', 'Other')
Но результат
1018 *