пытаясь объединить столбцы из разных файлов Excel - PullRequest
1 голос
/ 26 февраля 2020

enter image description here хорошо, я пытаюсь объединить столбцы из разных файлов Excel. например, один файл имеет адрес1, адрес2, город, штат, почтовый индекс, а другой - адрес местоположения, город, штат, почтовый индекс. я добавил файлы Excel, вы можете увидеть из кода ниже, что я без проблем объединил первый набор столбцов. проблема заключается в объединении второго набора столбцов, любые советы приветствуются. картинка ниже - результат, который я ищу

import os
import pandas as pd
import numpy as np
path = os.getcwd()
files = os.listdir(path)
files_xls = [f for f in files if f[-4:] == 'xlsx']
df = pd.DataFrame()
for f in files_xls:
  qw = pd.read_excel(f)
  df = df.append(qw)
  df = df.replace(np.nan,' ', regex=True)
  cf = df.iloc[:, df.columns.str.contains('address1|address2|city|state|zip|Location Address|City|State|ZIP', case=False)]
  vf= df['address1'].map(str) + '-' + df['address2'].map(str) + '-' + df['city'].map(str) + '-' + df['state'].map(str) + '-' + df['zip'].map(str),
  df['Location Address'].map(str) + '-' + df['City'].map(str) + '-' + df['State'].map(str) + '-' + df['ZIP'].map(str)
  export_csv = vf.to_csv('dataframe.csv', index=None, header=True)

1 Ответ

0 голосов
/ 27 февраля 2020

Я добавил вам вторую часть в переменную, создал еще одну DF и добавил обе части в другую DF, а затем записал в файл CSV

import os
import pandas as pd
import numpy as np
path = os.getcwd()
files = os.listdir(path)

files_xls = [f for f in files if f[-4:] == 'xlsx']
df = pd.DataFrame()
df1 = pd.DataFrame()
for f in files_xls:
    qw = pd.read_excel(f)
    df = df.append(qw)
    df = df.replace(np.nan,' ', regex=True)
    cf = df.iloc[:, df.columns.str.contains('address1|address2|city|state|zip|Location_Address|City|State|ZIP', case=False)]
    vf = df['address1'].map(str) + '-' + df['address2'].map(str) + '-' + df['city'].map(str) + '-' + df['state'].map(str) + '-' + df['zip'].map(str)
    vf1 = df['Location_Address'].map(str) + '-' + df['City'].map(str) + '-' + df['State'].map(str) + '-' + df['ZIP'].map(str)
    df1['part1'] = vf
    df1['part2'] = vf1
    export_csv = df1.to_csv('dataframe.csv', index=None, header=True)

output

part1,part2
300 DUFFERIN AVE - LL119- -london-OH-N6A 4L9,150 jimmy ave-md- -19977
301 DUFFERIN AVE - LL119- -london-OH-N6A 4L10,151 jimmy ave-md- -19978
302 DUFFERIN AVE - LL119- -london-OH-N6A 4L11,152 jimmy ave-md- -19979
303 DUFFERIN AVE - LL119- -london-OH-N6A 4L12,153 jimmy ave-md- -19980
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...