У меня есть Pandas DataFrame, в котором есть категорический столбец:
df = pd.DataFrame({'Source': ['Coronavirus','Sars','sars','coronavirus',
'CoronaVirus','Sars']})
df["Source"] = df["Source"].astype('category')
print(df)
Source
0 Coronavirus
1 Sars
2 sars
3 coronavirus
4 CoronaVirus
5 Sars
Обратите внимание на разницу в способе написания текста, например (CoronaVirus против Coronavirus против Coronavirus). Чего я хочу достичь sh, так это преобразовать весь текст того же , то есть коронавирус и sars , но независимо от того, как он написан (заглавная буква, et c.) и объедините их всех. Таким образом, желаемый результат будет:
Source
0 Coronavirus
1 Sars
2 Sars
3 Coronavirus
4 Coronavirus
5 Sars
Неважно, как будет получен конечный результат (коронавирус или коронавирус).
Заранее спасибо.