Как прочитать CSV-файл в dataframe с помощью панд - PullRequest
1 голос
/ 15 мая 2019

Я только что получил CSV-файл, который я хочу загрузить набор данных в качестве кадра данных, используя панды. Однако я немного запутался в этом формате данных.

Вот пример данных для двух строк:

Name=John, Gender=M, BloodType=A, Location=New York, Age=18
Name=Mary, Gender=F, BloodType=AB, Location=Seatle, Age=30

Как загрузить этот набор данных в фрейм данных со столбцами (Имя, Пол, Тип крови и т. Д.)?

Я буду признателен, если кто-то даст мне советы для начала!

Ответы [ 2 ]

0 голосов
/ 15 мая 2019

Использование read_csv с header=None первым:

import pandas as pd

temp=u"""Name=John,Gender=M,BloodType=A,Location=New York,Age=18
Name=Mary,Gender=F,BloodType=AB,Location=Seatle,Age=30"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=None)
print (df)
           0         1             2                  3       4
0  Name=John  Gender=M   BloodType=A  Location=New York  Age=18
1  Name=Mary  Gender=F  BloodType=AB    Location=Seatle  Age=30

Затем DataFrame.apply с Series.str.split и выберите вторые списки, последние имена столбцов изменения:

df1 = df.apply(lambda x: x.str.split('=').str[1])
df1.columns = df.iloc[0].str.split('=').str[0].rename(None)
#if necessary
df1['Age'] = df1['Age'].astype(int)
print (df1)
   Name Gender BloodType  Location  Age
0  John      M         A  New York   18
1  Mary      F        AB    Seatle   30
0 голосов
/ 15 мая 2019

Используйте метод pandas read_csv для чтения файла csv. Вот пример программы, как вы можете это сделать:

import pandas as pd

data = pd.read_csv("path_to_csv_file")

print(data)
...