Искаженный символ при импорте CSV, включая немецкий язык в Colab - PullRequest
0 голосов
/ 03 августа 2020

Когда я пытался импортировать файл csv, поскольку файлы не закодированы в UTF-8, я прочитал файл csv, используя demographic = pd.read_csv('./data/demographic_data.csv', delimiter=';', engine='python'), но это немецкий набор данных, и каждый умляут был заменен знаком вопроса .

, затем я попытался преобразовать файл csv в utf8, затем импортировать, запустив demographic = pd.read_csv('./data/demographic_data_without.csv', delimiter=';', engine='python',encoding="utf-8"), и получить другие искаженные символы

Как избежать искаженного символа а умлауты показать? Мой товарищ по лаборатории использует тот же набор данных, но он не сталкивался с этой проблемой, потому что его компьютер настроен на немецкий язык? Я могу печатать умляуты напрямую, когда запускаю print("ä") et c, но когда я импортирую файлы, содержащие немецкий язык, они просто превращаются в искаженный символ.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...