Игнорировать исключения dtype при импорте csv в Python - PullRequest
1 голос
/ 08 июля 2019

Предположим, у меня есть натуральная переменная, например, "возраст" в моем CSV-Dataset. Этот набор данных является потоковым, поскольку некоторые значения являются строками, например, "Отсутствует".

Этот код

personal_info = pd.read_csv("Age.csv", sep=',')

дает мне ошибку

DtypeWarning: Columns (6,10) have mixed types. Specify dtype option on import or set low_memory=False.

Добавление dtype

personal_info = pd.read_csv("Age.csv", sep=',', error_bad_lines=False,
                               dtype={'age': int})

взрывается при обнаружении строки «отсутствует».

invalid literal for int() with base 10: 'missing'

Как игнорировать строки со значениями не в переменной области?

1 Ответ

2 голосов
/ 08 июля 2019

Вы можете использовать na_values аргумент:

personal_info = pd.read_csv("Age.csv", sep=',', error_bad_lines=False,
                           dtype={'age': int},na_values=['missing'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...