Question

Я создал приложение, которое считывает данные, используя pd.read_csv. Мы получаем несколько наборов данных, в которых есть столбцы, содержащие только пропущенные значения (пустые ячейки). Есть ли способ использовать pandas, чтобы не загружать эти столбцы в фрейм данных? Поскольку набор данных может быть довольно большим, было бы удобнее игнорировать их на этапе предварительной загрузки.

Конечно, я мог бы удалить их из листа Excel, но я стремлюсь сделать загрузку данных автоматизированной. насколько возможно.

Hakob Julfayan · Answer 1 · 30 апреля 2020

Вы можете использовать pd.read_csv (file, keep_default_na = False). Все значения NA не будут загружены, но вместо них будут пустые строки, что сэкономит память. Для более подробной информации вы можете прочитать: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html.

Игнорировать столбцы, которые содержат только пропущенные значения, используя pd.read_csv

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Игнорировать столбцы, которые содержат только пропущенные значения, используя pd.read_csv

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов