Итак, у меня есть два кадра данных.первый фрейм данных набор данных содержит несколько столбцов, в этом фрейме данных я буду использовать набор данных ['text_msg'] , эти столбцы содержат текстовые данные.
Второй Dataframe предложений_to_exclude содержит данные, тип которых является типом текста.
Столбец, который я буду использовать в этом фрейме данных, это предложений_to_exclude ['предложений'] .
Что мне нужно сделать, это проверить, есть ли предложения из предложений_to_exclude ['предложения'] в первом кадре данных и удалить целое предложение.
Я пробовал функцию, ноу меня это не сработало: вот функция, которую я использовал ==>
def remove_words(data):
words_to_remove = sentences_to_exclude['sentences'].lower().split(" ")
text_body = dataset['text_msg']
for word in words_to_remove:
text_body = text_body.replace(word,'' )
return text_body
Вот пример предложений_to_exclude ['предложений']
для оптимальной ситуации, в том числе для информации
, а для первого кадра данных приведен пример набора данных ['text_msg'] :
для получения информации о происшествии, не имеющего отношения к делу, с указанием причины получения: - код транзакции: - номер клиента / коммандный клиент: - критерии выполнения и сообщения (читатель)ru pj) description detaille votre demande
Надеюсь, что мой запрос понятен Заранее благодарен за помощь
Пример данных
sentences = ['code transaction', 'Pour un traitement efficace']
text = [ ' i should delete code transaction ', ' i am trying to delete Pour un traitement efficace only from this sentence ' ]
df1 = pd.DataFrame({'Sentences ': sentences })
df2 = pd.DataFrame({'Text': text})