Можете ли вы описать ваш вариант использования немного больше, пожалуйста?
В общем, я бы предложил преобразовать данные в Excel в формат с поддержкой искры, такой как CSV или Parquet. С этого момента данные можно читать с помощью Spark и обрабатывать с помощью deequ.