Удалить 1-й и 3-й ряд Df, сохраняя 2-й ряд в качестве заголовка - PullRequest
0 голосов
/ 21 ноября 2018

начал изучать этот материал сегодня, поэтому, пожалуйста, прости мое невежество.

Мои данные находятся в csv и, как описано в заголовке, я хотел бы исключить первый и третий ряд, сохраняя второй ряд в качестве заголовков.CSV выглядит следующим образом:

"Title"
Date, time, count, hours, average
"empty row"

Набор данных начинается в строке, следующей за пустой строкой.

Ответы [ 2 ]

0 голосов
/ 21 ноября 2018

Используйте параметр header=1 в read_csv для чтения второй строки в столбцах только потому, что по умолчанию исключены пустые строки:

import pandas as pd

temp=u"""Title
Date,time,count,hours,average

2015-01-01,25:02:10,10,20,15"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=1)

print (df)
         Date      time  count  hours  average
0  2015-01-01  25:02:10     10     20       15
0 голосов
/ 21 ноября 2018

Использование параметра skiprows pd.read_csv:

from io import StringIO

x = StringIO("""Title
Date, time, count, hours, average

2018-01-01, 15:23, 16, 10, 5.5
2018-01-02, 16:33, 20, 5, 12.25
""")

# replace x with 'file.csv'
df = pd.read_csv(x, skiprows=[0, 2])

print(df)

         Date    time   count   hours   average
0  2018-01-01   15:23      16      10      5.50
1  2018-01-02   16:33      20       5     12.25

На самом деле достаточно skiprows=[0], поскольку пустые строки по умолчанию исключаются, т.е. поведение по умолчанию равно skip_blank_lines=True.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...