Когда я пытался импортировать файл csv, поскольку файлы не закодированы в UTF-8, я прочитал файл csv, используя demographic = pd.read_csv('./data/demographic_data.csv', delimiter=';', engine='python')
, но это немецкий набор данных, и каждый умляут был заменен знаком вопроса .
, затем я попытался преобразовать файл csv в utf8, затем импортировать, запустив demographic = pd.read_csv('./data/demographic_data_without.csv', delimiter=';', engine='python',encoding="utf-8")
, и получить другие искаженные символы
Как избежать искаженного символа а умлауты показать? Мой товарищ по лаборатории использует тот же набор данных, но он не сталкивался с этой проблемой, потому что его компьютер настроен на немецкий язык? Я могу печатать умляуты напрямую, когда запускаю print("ä")
et c, но когда я импортирую файлы, содержащие немецкий язык, они просто превращаются в искаженный символ.