Я пытаюсь выполнить операции в памяти с файлами, хранящимися в лазурном датаке. Я не могу найти документацию относительно использования соответствующего шаблона без использования ADL Downloader.
Для одного файла это код, который я использую
filename = '/<folder/<filename>.json'
with adlsFileSystemClient.open(filename) as f:
for line in f:
<file-operations>
Но как мы фильтруем на основеимя файла (соответствие строк) или на основе даты последнего изменения.
Когда я использовал U-SQL, у меня была возможность отфильтровать набор файлов на основе последнего измененного параметра.
DECLARE EXTERNAL @TodaysTime = DateTime.UtcNow.AddDays(-1);
@rawInput=
EXTRACT jsonString string,
uri = FILE.URI()
,modified_date = FILE.MODIFIED()
FROM @in
USING Extractors.Tsv(quoting : true);
@parsedInput=
SELECT *
FROM @rawInput
WHERE modified_date > @TodaysTime;
IsСуществуют ли аналогичные параметры для фильтрации файлов, измененных в течение указанного периода, при использовании adlsFileSystemClient?
Github Проблема: https://github.com/Azure/azure-data-lake-store-python/issues/300
Любая помощь приветствуется.