Я должен выполнить некоторые проверки данных в выходном файле ETL, я использую библиотеку Pandas_Schema и, в качестве примера, я включил две встроенные проверки - LeadingWhitespaceValidation
и TrailingWhitespaceValidation
, у меня довольно много похожих проверяет, что я собираюсь сделать, поэтому я решил сохранить столбцы для проверки и правила для проверки в электронной таблице, и я хочу использовать значения этих столбцов для автоматической генерации схемы, используемой Pandas_Schema, в следующем формате. Я новичок в программировании, поэтому я не мог понять, как преобразовать данные Excel в формат «Схема», приведенный ниже.
Благодарим вас, если кто-то может помочь с программой python для преобразования ниже столбца электронной таблицы. значения в формате схемы.
from pandas_schema import Column, Schema
from pandas_schema.validation import (
LeadingWhitespaceValidation,
TrailingWhitespaceValidation
)
Ниже приведен пример формата Excel
**Column1** **Column2** **Column3**
Account_Number LeadingWhitespaceValidation() TrailingWhitespaceValidation()
Coupon_Rate LeadingWhitespaceValidation() TrailingWhitespaceValidation()
Currency_Code_Local LeadingWhitespaceValidation() TrailingWhitespaceValidation()
Country_of_Risk LeadingWhitespaceValidation() TrailingWhitespaceValidation()
Security_Type LeadingWhitespaceValidation() TrailingWhitespaceValidation()
schema = Schema([
Column('As_of_Date', [LeadingWhitespaceValidation(), TrailingWhitespaceValidation()] ),
Column('Account_Number', [LeadingWhitespaceValidation(), TrailingWhitespaceValidation()]),
Column('Coupon_Rate', [LeadingWhitespaceValidation(), TrailingWhitespaceValidation()]),
Column('Currency_Code_Local', [LeadingWhitespaceValidation(), TrailingWhitespaceValidation()]),
Column('Country_of_Risk', [LeadingWhitespaceValidation(), TrailingWhitespaceValidation()]),
Column('Security_Type', [LeadingWhitespaceValidation(), TrailingWhitespaceValidation()])
])