Я столкнулся с проблемой применения нечетких логик c для очистки данных в python. Мои данные выглядят примерно так
data=pd.DataFrame({'Employer':['Deloitte','Accenture','Accenture Solutions Ltd','Accenture USA', 'Ernst & young',' EY', 'Tata Consultancy Services','Deloitte Uk'], "Count":['140','120','50','45','30','20','10','5']})
data
Я использую нечеткие логики c для сравнения значений во фрейме данных. В конечном выводе должен быть третий столбец с таким результатом:
data_out=pd.DataFrame({'Employer':['Deloitte','Accenture','Accenture Solutions Ltd','Accenture USA', 'Ernst & young',' EY', 'Tata Consultancy Services','Deloitte Uk'], "New_Column":["Deloitte",'Accenture','Accenture','Accenture','Ernst & young','Ernst & young','Tata Consultancy Services','Deloitte']})
data_out
Поэтому, если вы видите, я хочу, чтобы менее встречающиеся значения имели новую запись в качестве нового столбца с наиболее встречающимся значением его типа. Вот где нечеткая логика c полезна.