pd.saveto и pd.read_csv добавляет заголовок и индексный столбец - PullRequest
0 голосов
/ 09 ноября 2018

У меня есть датафрейм, который я сохраняю так:

Y_train_1.head()

0    4691.0
1    4661.0
2    4631.0
3    4601.0
4    4571.0

Y_train_1.to_csv("Y_train.csv", sep='\t', decimal=',')

тогда я снова прочитал это так:

Y_train = pd.read_csv("Y_train.csv", sep='\t', decimal=',', index_col=None, header=None))
Y_train.head()

enter image description here

с использованием

Y_train = pd.read_csv("Y_train.csv", sep='\t', decimal=',', index_col=[0], header=None)

Я все еще получаю такой фрейм данных, который отличается от предыдущего?

enter image description here

Как я могу получить тот же Dataframe, что и раньше?

USI

Спасибо, R

1 Ответ

0 голосов
/ 09 ноября 2018

При работе с Series добавить параметр squeeze=True:

print (type(Y_train_1))
<class 'pandas.core.series.Series'>

print (Y_train_1)
0    4691.0
1    4661.0
2    4631.0
3    4601.0
4    4571.0
dtype: float64

Y_train_1.to_csv("Y_train.csv", sep='\t', decimal=',', header=None)
Y_train = pd.read_csv("Y_train.csv", 
                      sep='\t', 
                      decimal=',', 
                      index_col=[0], 
                      squeeze=True, 
                      header=None)
print (Y_train)
0
0    4691.0
1    4661.0
2    4631.0
3    4601.0
4    4571.0
Name: 1, dtype: float64

Y_train_1.to_csv("Y_train.csv", sep='\t', decimal=',', index=False, header=None)
Y_train = pd.read_csv("Y_train.csv", sep='\t', decimal=',', squeeze=True, header=None)
print (Y_train)
0    4691.0
1    4661.0
2    4631.0
3    4601.0
4    4571.0
Name: 0, dtype: float64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...