Question

У меня есть два кадра данных, прочитанных из двух csv файлов.

train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")

В train фрейме данных у меня есть 891 строк, а в test фрейме данных у меня 418 строк.

Я объединяю эти два кадра данных в новый кадр данных full_data.

full_data = pd.concat([train, test])

full_data теперь содержит 1309 строк, НО проблема в том, что генерируется значение по умолчаниюindex являются отдельными для обоих данных.Оба index запускаются с одного.

НО я хочу, чтобы индекс данных test начинался с 892 вместо 0.

Как мне это сделать?

Tapabrata Mukherjee · Answer 1 · 06 июня 2018

Вы можете сделать что-то вроде: full_data = pd.concat([df1, df2]).reset_index(drop=True)

jezrael · Answer 2 · 06 июня 2018

Используйте параметр ignore_index=True in concat:

full_data = pd.concat([train, test], ignore_index=True)

Конкатенация с DataFrame даст два отдельных стартовых индекса

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Конкатенация с DataFrame даст два отдельных стартовых индекса

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов