Я пытаюсь очистить мою переменную df ['Country'], создав новую переменную df ['Country Clean'], которая принимает значение переменной страны, если находит ее в столбце df ['Country'].
Я понял, что, если я повторю свою команду, я также удалю свои предыдущие результаты и получу только переменную, сообщающую результаты для 'Россия'
Есть ли способ сделать это?
data = {'Number':['1', '2', '1', '2', '1', '2'], 'Country':['Italy 1', 'Italie', 'Ecco', 'Russia is in Euroasia' , 'Yugoslavia', 'Russia']}
df = pd.DataFrame(data)
df['Country Clean'] = df['Country'].str.replace(r'(^.*Italy.*$)', 'Italy')
df['Country Clean'] = df['Country'].str.replace(r'(^.*Russia.*$)', 'Russia')
Ожидаемый результат
data2 = {'Number':['1', '2', '1', '2', '1', '2'], 'Country':['Italy', 'Italy', NaN, 'Russia' , NaN , 'Russia']}
exp = pd.DataFrame(data2)
exp