Возможно, просто исходя из того, что вы вставили, ваши значения не ''
, а символы Unicode.@jezrael ссылается на это в своем комментарии.Таким образом, замена на основе ascii '
не перехватывает Unicode.
Один из возможных способов проверить это состоит в следующем:
import unidecode
(df.applymap(unidecode.unidecode)
.apply(lambda s: s.str.replace("'", "")
)
Этодве вещи:
Выход из Unicode в ascii с использованием библиотеки unidecode
, которая является довольно удобной универсальной библиотекой для преобразования символов Unicode в довольно разумные эквиваленты ascii,Если вы много занимаетесь обработкой текста и нормализацией строк, это действительно может помочь.
Использует библиотеку Pandas 'str
, которая является удивительным расширением.Если вы будете делать EDA над строковыми данными на регулярной основе, как я, это буквально изменит вашу жизнь.Я был в темноте в течение многих лет, прежде чем я встретил эту библиотеку.(Еще одна замечательная жемчужина панд - это библиотека dt
.)