Как использовать панды для выбора определенных столбцов в CSV-файле - PullRequest
2 голосов
/ 04 июля 2019

Я только начал свое путешествие по программированию, чтобы посмотреть и просмотреть кучу учебных пособий на YouTube, и сейчас пытаюсь «импортировать» набор данных из SPSS в python с помощью jupyter.

До сих пор мне удалось преобразовать .sav в файл .csv и прочитать его, используя код ниже. Я хочу выбрать определенные столбцы в моих данных и сохранить их в новом CSV-файле, чтобы провести их анализ и попытаться создать сценарий для прогнозирования определенных вещей и характеристик. Проблема в том, что у меня есть сотни столбцов данных, и я хочу начать только с 3 или 4.

Я пытался использовать функцию data.drop (), но вскоре понял, что должен быть лучший способ сделать это?

Заранее извиняюсь за неспособность объяснить это лучше, так как это мой самый первый пост здесь.

import pandas as pd
df = pd.read_csv('csvfile.csv')
df

Ответы [ 2 ]

1 голос
/ 04 июля 2019

Вы можете выбрать столбцы по их именам.

import pandas as pd 
df = pd.read_csv('csvfile.csv')
final_df = df[['col1','col2','col3']]

или вы можете выбрать их по индексам

final_df = df.iloc[:,[0,1,2]]
0 голосов
/ 04 июля 2019

Используйте это:

import pandas as pd
df = pd.read_csv('csvfile.csv' , usecols = ['col1','col2'])
df

Вместо 'col1' и 'col2' введите имена столбцов. Затем, чтобы записать их в другой CSV, сделайте это:

df.to_csv('csv_file_1.csv' , index = False)
...