Question

Есть несколько путей к паркетному файлу:

/ A / B / C = 'str1' / д = 'ул'

/ A / B / C = 'str2' / д = 'ул'

/ A / B / C = 'str3' / д = 'ул'

Я хочу прочитать файлы паркета следующим образом:

df = spark.read.parquet('/a/b/c='*'/d='str')

но это не работает с использованием "*" подстановочного знака. Как я могу это сделать? спасибо за помощь

Sergey Khudyakov · Answer 1 · 16 мая 2018

Вам нужно экранировать одинарные кавычки:

df = spark.read.parquet('/a/b/c=\'*\'/d=\'str\'')

... или просто использовать двойные кавычки:

df = spark.read.parquet("/a/b/c='*'/d='str'")

как прочитать файл hdfs с подстановочным знаком, используемым pyspark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.