Распечатайте дублирующиеся значения листа Excel на основе ключа в сторону или вниз, используя Python - PullRequest
2 голосов
/ 04 июля 2019

У меня есть несколько повторяющихся значений для предоставленного ключа в моем листе Excel, и я хочу либо выделить их, либо распечатать все значения, включая повторяющиеся значения вбок или вниз, используя Python.

Мне удалось напечатать дубликат кода вниз с предоставленным кодом, но он работает более чем на двух листах.

Для двух листов это дает результат, как показано на рисунке ниже, где печатаются только дубликаты, а не другая информация. Ключ для моей таблицы 'Customer No'

Таблица 1:

Customer No    Sales Quantity     Invoice Point
2010            1004              JJ
2011            1005              KK
2012            1010              LL
2013            1009              MM
2014            1008              NN

Таблица 2:

Sales Quantity    P.Description    P.Location    P.Type    Customer No
1001              Lakhotia Plant   AAAA          TO        2012
1002              Shyam Steel      ZZZZ          TO        2013
1003              bad              WWWW          TA        2020
1004              okay             UUUU          TI        2021
1005              good             PPPP          TY        2022

Таблица результатов:

Customer No  Sales Quantity  Invoice Point  P.Description  P.Location P.Type
2010            1004              JJ
2011            1005              KK
2012            1010              LL
2012            1001                        Lakhotia Plant   AAAA     TO  
2013            1009              MM
2013            1002                        Shyam Steel      ZZZZ     TO
2014            1008              NN
2020            1003                        bad              WWWW     TA
2021            1004                        okay             UUUU     TI                           
2022            1005                        good             PPPP     TY  

Здесь приведены подробности о 2012 и 2013 гг. Вместе с другими записями

Мой код:

    import pandas as pd
    import numpy as np
    import glob

    df=pd.read_excel("C:/Users/Downloads/sales-mar-2014.xlsx")
    status=pd.read_excel("C:/Users/Downloads/customer-status.xlsx")

    all_data_st=pd.merge(df,status,on='Customer No')


    all_data_st.to_excel("E:/final.xlsx",header=True, index=False)

И вывод будет следующим:

Result

Ссылка на листы, где Лист 1 и Лист 2 - мои данные, а лист 3 - мой ожидаемый результат:

Google Sheet

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...