У меня есть DataFrame, подобный этому:
df = pd.DataFrame({'Source1': ['Corona,Corona,Corona','Sars,Sars','Corona,Sars',
'Sars,Corona','Sars'],
'Area': ['A,A,A,B','A','A,B,B,C','C,C,B,C','A,B,C']})
df
Source1 Area
0 Corona,Corona,Corona A,A,A,B
1 Sars,Sars A
2 Corona,Sars A,B,B,C
3 Sars,Corona C,C,B,C
4 Sars A,B,C
Я хочу проверить каждую ячейку в каждом столбце (реальные данные имеют много столбцов) и найти частоту каждого уникального слова (мы можем различить guish уникальные слова на «,»), и заменить всю запись на наиболее частое слово.
В случае с ie не имеет значения, какое слово заменить. Таким образом, желаемый результат будет выглядеть следующим образом:
df
Source Area
0 Corona A
1 Sars A
2 Corona B
3 Sars C
4 Sars A
В этом случае я случайно выбрал первое слово, когда оно находится в ie, но это действительно не имеет значения.
Заранее спасибо.