Игнорировать столбцы, которые содержат только пропущенные значения, используя pd.read_csv - PullRequest
0 голосов
/ 30 апреля 2020

Я создал приложение, которое считывает данные, используя pd.read_csv. Мы получаем несколько наборов данных, в которых есть столбцы, содержащие только пропущенные значения (пустые ячейки). Есть ли способ использовать pandas, чтобы не загружать эти столбцы в фрейм данных? Поскольку набор данных может быть довольно большим, было бы удобнее игнорировать их на этапе предварительной загрузки.

Конечно, я мог бы удалить их из листа Excel, но я стремлюсь сделать загрузку данных автоматизированной. насколько возможно.

1 Ответ

0 голосов
/ 30 апреля 2020

Вы можете использовать pd.read_csv (file, keep_default_na = False). Все значения NA не будут загружены, но вместо них будут пустые строки, что сэкономит память. Для более подробной информации вы можете прочитать: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...