Я загружаю данные в pandas dataframe
из листа Excel, и во многих столбцах есть много не отображаемых символов, которые я хочу преобразовать.
Наиболее распространенным является апостроф. используется в сокращении; например, doesn't
, что выглядит как doesn’t
.
Раньше я использовал:
str.encode('ascii', errors='ignore').decode('utf-8')
, но для этого мне требовалось знать, какие столбцы мне нужно исправить.
В этом случае у меня есть 103 столбца, каждый из которых может содержать тот или иной тип проблем, подобных этому.
Я ищу способ просто заменить все без исключения проблемы во всем dataframe
.
Есть ли быстрый и простой способ сделать это для всего dataframe
без необходимости передавать каждый столбец функции?