Я новичок в Scala
и Amazon Deequ
.Меня попросили написать код Scala
, который вычислял бы метрики (например, Completeness
, CountDistinct
и т. Д.) Для ограничений, используя Deequ
в исходных csv
файлах, хранящихся в S3
, и загружал сгенерированные метрикив таблице Glue, которая в дальнейшем будет использоваться для составления отчетов.
Может ли кто-нибудь помочь мне, указав мне правильное направление на онлайн-ресурсы, которые помогут мне достичь этого?Я новичок в Scala
и Deequ
.Так может кто-нибудь дать мне пример кода Scala
и объяснить, как можно использовать библиотеки deequ
и т. Д.?
Пожалуйста, дайте мне знать, если для объяснения моего вопроса требуется дополнительная информация.