Совпадение с шаблоном Apache Beam ReadFromText () не дает результатов - PullRequest
1 голос
/ 13 июня 2019

Я пишу конвейер Apache Beam на python и пытаюсь загрузить несколько текстовых файлов, но при использовании сопоставления с образцом возникает ошибка. Когда я передаю точное имя файла, конвейер работает правильно.

Например: files = p | 'Read' >> ReadFromText('lyrics.txt')

Однако при использовании сопоставления с шаблоном возникает ошибка:

files = p | 'Read' >> ReadFromText('lyrics*')

IOError: не найдено файлов на основе шаблона файла

В этом примере у меня есть несколько файлов, которые начинаются с «текст».

Я пробовал много разных типов шаблонов, но ничего не добился, кроме передачи полного имени файла. Есть ли другой способ применить сопоставление с образцом в этом случае?

Обновлено с ответом

Если вы работаете в Windows, не забудьте использовать обратную косую черту вместо прямой косой черты при указании каталогов. Например: ReadFromText('.\lyrics*')

1 Ответ

1 голос
/ 14 июня 2019

Это похоже на ошибку. Я подал https://issues.apache.org/jira/browse/BEAM-7560. А пока попробуйте абсолютный путь или ReadFromText('./lyrics*').

...