Автоматическое тестирование трубопровода Spark параллельно - PullRequest
0 голосов
/ 14 февраля 2020

Мне нужно проверить, какие технологические опции мы используем для тестирования автоматизации (QA) для конвейера обработки данных в Spark.

Постановка задачи: Эффективно оптимизировать функциональное тестирование работы зажигания BigData посредством автоматизации. Необходимо проверить эффективное создание и проверку данных при параллельном запуске сценария ios

1 Ответ

0 голосов
/ 14 февраля 2020

Для тестирования конвейера данных нет доступных средств / средств тестирования автоматизации.

Однако вы можете создать собственную платформу искры для проверки данных в различных зонах данных (L0, L1, L2 и c). ..)

Spark может считывать различные типы данных (csv, xml, json, текст, паркет и т. Д. c ..) в фрейм данных.

И вы можете получить лог c для сравнения двух фреймов данных.

...