Получение имен столбцов из набора данных - PullRequest
0 голосов
/ 28 мая 2019

Я пытаюсь получить имена столбцов из грязного набора данных. Имя столбца начинается с символа «=». Есть ли быстрый способ сделать это без зацикливания всех данных? Как это выглядит сейчас

import pandas as pd
import numpy as np

missing_values=["n/a", "na", "--"]

df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values)
df.head()

1 Ответ

1 голос
/ 28 мая 2019

Похоже, вы читаете свою первую строку как имена заголовков.В методе read_csv передайте аргумент header=None.Используйте Series.str.split для установки имен столбцов:

missing_values=["n/a", "na", "--"]
df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values, header=None)

df.columns = df.loc[0].str.split('=').str[0].values
...