У меня есть несколько повторяющихся значений для предоставленного ключа в моем листе Excel, и я хочу либо выделить их, либо распечатать все значения, включая повторяющиеся значения вбок или вниз, используя Python.
Мне удалось напечатать дубликат кода вниз с предоставленным кодом, но он работает более чем на двух листах.
Для двух листов это дает результат, как показано на рисунке ниже, где печатаются только дубликаты, а не другая информация.
Ключ для моей таблицы 'Customer No'
Таблица 1:
Customer No Sales Quantity Invoice Point
2010 1004 JJ
2011 1005 KK
2012 1010 LL
2013 1009 MM
2014 1008 NN
Таблица 2:
Sales Quantity P.Description P.Location P.Type Customer No
1001 Lakhotia Plant AAAA TO 2012
1002 Shyam Steel ZZZZ TO 2013
1003 bad WWWW TA 2020
1004 okay UUUU TI 2021
1005 good PPPP TY 2022
Таблица результатов:
Customer No Sales Quantity Invoice Point P.Description P.Location P.Type
2010 1004 JJ
2011 1005 KK
2012 1010 LL
2012 1001 Lakhotia Plant AAAA TO
2013 1009 MM
2013 1002 Shyam Steel ZZZZ TO
2014 1008 NN
2020 1003 bad WWWW TA
2021 1004 okay UUUU TI
2022 1005 good PPPP TY
Здесь приведены подробности о 2012 и 2013 гг. Вместе с другими записями
Мой код:
import pandas as pd
import numpy as np
import glob
df=pd.read_excel("C:/Users/Downloads/sales-mar-2014.xlsx")
status=pd.read_excel("C:/Users/Downloads/customer-status.xlsx")
all_data_st=pd.merge(df,status,on='Customer No')
all_data_st.to_excel("E:/final.xlsx",header=True, index=False)
И вывод будет следующим:
Ссылка на листы, где Лист 1 и Лист 2 - мои данные, а лист 3 - мой ожидаемый результат:
Google Sheet