Я пытаюсь использовать функцию findall, чтобы найти 4 конкретных слова в строке в столбце информационного кадра.
df = pd.DataFrame({'case':('Case1','Case2','Case3','Case4'),
'text':('good boy', 'bad girl', 'yoghurt', 'good girl yoghurt')})
case text
0 Case1 good boy
1 Case2 bad girl
2 Case3 yoghurt
3 Case4 good girl yoghurt
Допустим, я хочу найти 'good' и 'yoghurt', создаваясписок, в котором этот набор данных должен был бы дать мне: ['good', '', 'yoghurt', 'good, yoghurt'] - так, давая пустую строку или возвращая None, и давая мне оба слова, если они находятся в одной строке.Затем я могу создать из него новый столбец, поэтому важно, чтобы я получал все строки, даже если они пустые.
Большинство примеров findall включают символы регулярных выражений, и я пытаюсь заполнить их списком слов.