как прочитать файл hdfs с подстановочным знаком, используемым pyspark - PullRequest
0 голосов
/ 13 мая 2018

Есть несколько путей к паркетному файлу:

/ A / B / C = 'str1' / д = 'ул'

/ A / B / C = 'str2' / д = 'ул'

/ A / B / C = 'str3' / д = 'ул'

Я хочу прочитать файлы паркета следующим образом:

df = spark.read.parquet('/a/b/c='*'/d='str')

но это не работает с использованием "*" подстановочного знака. Как я могу это сделать? спасибо за помощь

1 Ответ

0 голосов
/ 16 мая 2018

Вам нужно экранировать одинарные кавычки:

df = spark.read.parquet('/a/b/c=\'*\'/d=\'str\'')

... или просто использовать двойные кавычки:

df = spark.read.parquet("/a/b/c='*'/d='str'")
...