У меня есть два столбца, которые представляют собой комбинацию слов, разделенных запятыми, и отдельных слов в строковом формате. col1
всегда будет содержать только одно слово. В этом примере я буду использовать слово Dog в качестве слова в col1
, но оно будет отличаться от реальных данных, поэтому, пожалуйста, не делайте решение, которое использует регулярное выражение для Dog в частности.
df = pd.DataFrame({"col1": ["Dog", "Dog", "Dog", "Dog"],
"col2": ["Cat, Mouse", "Dog", "Cat", "Dog, Mouse"]})
Я хочу проверить, появляется ли слово из col1
в строке col2
, и если оно есть, я хочу удалить это слово из col2
. Но имейте в виду, что я хочу сохранить оставшуюся часть строки, если осталось больше слов. Таким образом, будет go отсюда:
col1 col2
0 Dog Cat, Mouse
1 Dog Dog
2 Dog Cat
3 Dog Dog, Mouse
На это:
col1 col2
0 Dog Cat, Mouse
1 Dog
2 Dog Cat
3 Dog Mouse