Question

Я пытаюсь получить имена столбцов из грязного набора данных. Имя столбца начинается с символа «=». Есть ли быстрый способ сделать это без зацикливания всех данных? Как это выглядит сейчас

import pandas as pd
import numpy as np

missing_values=["n/a", "na", "--"]

df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values)
df.head()

Chris A · Answer 1 · 28 мая 2019

Похоже, вы читаете свою первую строку как имена заголовков.В методе read_csv передайте аргумент header=None.Используйте Series.str.split для установки имен столбцов:

missing_values=["n/a", "na", "--"]
df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values, header=None)

df.columns = df.loc[0].str.split('=').str[0].values

Получение имен столбцов из набора данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получение имен столбцов из набора данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы