Конкатенация с DataFrame даст два отдельных стартовых индекса - PullRequest
0 голосов
/ 06 июня 2018

У меня есть два кадра данных, прочитанных из двух csv файлов.

train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")

В train фрейме данных у меня есть 891 строк, а в test фрейме данных у меня 418 строк.

Я объединяю эти два кадра данных в новый кадр данных full_data.

full_data = pd.concat([train, test])

full_data теперь содержит 1309 строк, НО проблема в том, что генерируется значение по умолчаниюindex являются отдельными для обоих данных.Оба index запускаются с одного.

НО я хочу, чтобы индекс данных test начинался с 892 вместо 0.

Как мне это сделать?

Ответы [ 2 ]

0 голосов
/ 06 июня 2018

Вы можете сделать что-то вроде: full_data = pd.concat([df1, df2]).reset_index(drop=True)

0 голосов
/ 06 июня 2018

Используйте параметр ignore_index=True in concat:

full_data = pd.concat([train, test], ignore_index=True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...