Предполагая, что вы используете DataFrame Pandas, вы можете просто переназначить столбец для понимания списка, в котором вы проверяете наличие орфографических ошибок следующим образом:
misspellings = {'f', 'woman','femail','cis-female/femme','female (cis)','cis female','femake'}
mh2014['Gender'] = ["female" if entry in misspellings else entry for entry in mh2014['Gender']]
Мы используемустановлен для ускорения поиска орфографических ошибок, потому что он имеет O (1) среднее время поиска .
Если вы хотите добавить больше орфографических ошибок, чтобы поймать, измените список орфографических ошибок, возможно, загружая его изфайл, если список становится громоздким для жесткого кода.