У меня есть папка с файлами, похожими на -
./env_california_0100.xml
./env_california_0200.xml
./env_california_0300.xml
./env_california_0400.xml
./env_0100.xml
./env_0200.xml
./env_0300.xml
./env_0400.xml
с использованием pyspark. Если я хочу прочитать файлы, имена которых содержат строку 'california', то я бы использовал
df=spark.read.format("com.databricks.spark.xml").option("rowTag","someTag").load("/some_folder/*california*.xml")
Но как читать файлы, у которых нет строки 'california'?