С помощью Джареда и собственных исследований я нашел следующее решение:
df = pd.read_csv(DATAFILE_INPUT, sep='\t', skiprows=8, error_bad_lines=False, warn_bad_lines=False, decimal=',')
df.columns =['Zeit', 'Zyklus', 'Weg','Kraft', 'Dehnung', 'Temperatur', 'Temp. oben','Temp. mitte', 'Temp. untens']
df = df[df.Zeit.str.contains('Zeit') == False]
df.columns = ['s','segments','mm','kN','%','°C','°C','°C','°C']
df = df[df.s.str.contains('s') == False]
Спасибо всем за помощь.
Я пытаюсь использовать пандсоздать новый CSV-файл, но файл raw.date имеет в каждой x строках 4 строки.
python 2.7
Мой код:
DATAFILE_INPUT = 'test.dat 'DATAFILE_OUTPUT_1 =' test.out '
in_columns = ['a', 'b', 'c','d']
# read in data (skip some rows / column separator is a tab / no header use our names / decimal separator is a comma)
df = pd.read_csv(DATAFILE_INPUT, skiprows=1, sep='\t', header=None, names=in_columns, decimal=',')
out_columns = ['a','b', 'c', 'd']
df.index += 1
# save data (filename / print row numbers / tab separator / only print defined columns / decimal separator)
df.to_csv(path_or_buf=DATAFILE_OUTPUT_1, index=True, sep='\t', columns=out_columns, decimal='.')
вот пакеты, которые я использую:
import pandas as pd
лучший пример:
In: index a b c d
0 1,3 1,4 1,32 1,4325
1 2,234 2,123 3,123 1,123
2
4 name
5 guido
6 mother
7 2,123 2,123123 4,123123 5,123123
8 1,123123 2,123123 3,123123 4,123123
9 1,123123 2,123123 3,123123 4,123123
10
11 name
12 guido
13 mother
15 1,2134234 3,34324 3,234234 5,234234
и эточто я хочу в качестве вывода:
Out: index a b c d
0 1.3 1.4 1.32 1.4325
1 2.234 2.123 3.123 1.123
2 2.123 2.123123 4.123123 5.123123
3 1.123123 2.123123 3.123123 4.123123
4 1.123123 2.123123 3.123123 4.123123
5 1.2134234 3.34324 3.234234 5.234234
и так, что мне нужно сделать, удалить, стереть, игнорировать эти 4 строки
вот ссылка на мой образец данных ипервый результат.https://www.dropbox.com/s/syocsw1l3fyju3q/RF_P92_500_180_023_1.dat?dl=0 https://www.dropbox.com/s/or93sk6vxb9z836/test.out?dl=0] 2