У меня есть имена файлов metadata.txt, который содержит метаданные для всех файлов xlsx с именами листов и информацией заголовка col
Мне нужно сделать некоторые проверки, сравнивая metadata.txt с файлами xlsx и выбрасывать исключения. (Проверки приведены ниже)
У меня есть около 30 xlsx с разными листами (я привел пример для нескольких файлов)
Я новичок в Python, ищущий предложение / пример кода о том, как его можно достичь.
Validatons :
Check metadata.txt and compare with emp.xlsx , dept.xlsx,locations.xlsx
(basically i need to loop filenames and sheetnames from metadata.txt with
directory path C://Files)
if there is mismatch in header(ie Col_header of metadata with header of
xlsx(example: dept.xlsx(description not matching with dept_name) )
then throw error
If there is duplicates found with column header
(ex:locations.xlsx(loc_name repeated twice when it is compared with
metadata.txt) throw error
metadata.txt
filename:sheet_name:col_header
emp.xlsx:emp_details:emp_id,sal,dept_id,hiredate
dept.xlsx:dept_details:dept_id,dept_name,created_date
locations.xlsx:loc_details:loc_id,loc_name,created_date
emp.xlsx (SheetName: emp_details)
emp_id,sal,dept_id,hiredate
1,2000,10,10-jan-2018
2,4000,20,12-jan-2018
3,5000,30,13-jan-2018
dept.xlsx (SheetName: dept_details)
dept_id,description,created_date
10,HR,10-apr-2018
20,IT,20-may-2018
30,MED,12-jun-2018
locations.xlsx (SheetName: loc_details)
loc_id,loc_name,created_date,loc_name
100,BAN,10-jan-17,BAN
200,CHE,20-jan-17,CHE
Распечатать мои результаты будут в новый файл
File_name,count,systemdate,validationstatus
emp.xlsx,3,27-jan-19,succcess
dept.xlsx,3,27-jan-19,failed
locations.xlsx,3,27-jan-19,failed