выводить дополнительный столбец при объединении двух файлов .csv - PullRequest
0 голосов
/ 03 декабря 2018

Я довольно новичок в использовании панд, но мне удалось объединить два файла .csv, но при выводе его появляется дополнительный столбец, из которого я не знаю, откуда он.

.csv файл 1

Tweet,Month,Day,Year
Hello World,6,2,2013
I want ice-cream!,7,23,2013
Friends will be friends,9,30,2017
Done with school,12,12,2017

.csv файл 2

Month,Day,Year,Hour,Tweet
January,2,2015,12,Happy New Year
March,21,2016,7,Today is my final
May,30,2017,23,Summer is about to begin
July,15,2018,11,Ocean is still cold

Мой код

import numpy as np
import pandas as pd
#from datetime import *
import datetime

table1 = pd.read_csv('data1.csv', parse_dates={'Date':['Year', 
'Month','Day']})
table2 = pd.read_csv('data2.csv', parse_dates={'Date':['Year', 
'Month','Day']})
finaldf = (pd.concat([table1, table2[['Date', 
'Tweet']]]).sort_values('Date', ascending=False))
finaldf['Date'] = finaldf['Date'].dt.strftime('%d-%b-%y')
print(finaldf)
finaldf.to_csv('combined.csv', index=False)

когда вы запускаете мой код, онвыводит первый столбец с числами, как бы вы удалили это?и почему это появляется?Изображение внизу (вывод)

введите описание изображения здесь

Ответы [ 2 ]

0 голосов
/ 03 декабря 2018

Дополнительные столбцы - это просто индексы table1 и table2.

. Вы не можете иметь фрейм данных без индекса.Что вы можете сделать, это сбросить счет с final_df.reset_index(drop=True)

0 голосов
/ 03 декабря 2018

Таблица1 имеет индекс (0,1,2,3).
Таблица2 имеет индекс (0,1,2,3).
Поэтому, когда вы объединяете две таблицы, вы получаете индексы (0,1,2,3,0,1,2,3).

При сортировке их порядок изменяется.
enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...