Панды экспортирует предыдущие столбцы в дополнение к другим - PullRequest
0 голосов
/ 09 декабря 2018

Я пытаюсь экспортировать один конкретный столбец из CSV с несколькими гигабайтами с пандами в другой файл CSV, используя .to_csv.Однако вывод содержит два столбца вместо одного.Вот пример выходных данных: Case_Number 3 HZ250496 89 HZ250409 197 HZ250503 673 HZ250424 911 HZ250455 1108 HZ250447

, где Case_Number для столбца справа, потому что отступ в переполнении стека работает не слишком хорошо.В предыдущем столбце указан идентификатор дела для этого набора данных преступления.Я хочу только Case_Number.Мой код на Python, который я написал, чтобы сгенерировать это:

import pandas
import csv
data = pandas.read_csv("Chicago_Crimes_2012_to_2017.csv", low_memory=False)
case_number = data["Case_Number"]
data.to_csv('Case_Number.csv', columns = ["Case_Number"])

Что я могу делать не так?

1 Ответ

0 голосов
/ 09 декабря 2018

Используйте параметр usecols в read_csv, если хотите работать только со столбцом Case_Number, а затем index=False в DataFrame.to_csv во избежание index запись в csv:

import pandas as pd

data = pd.read_csv("Chicago_Crimes_2012_to_2017.csv", 
                   low_memory=False, 
                   usecols=["Case_Number"])
data.to_csv('Case_Number.csv', index=False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...