В U- SQL вы извлекаете все файлы, как вы сказали (@InputFile_Daily + "{*}.json"
), а затем при первом выборе применяете фильтр даты, и он извлекает только необходимые данные изнутри.
Пример:
DECLARE @input string = @"/temp/stackoverflow.json";
// Read input file
@inputData =
EXTRACT Account string,
Alias string,
Company string,
date DateTime,
Json string
FROM @input
USING Extractors.Text(delimiter : '\n', quoting : false);
@extractedFields =
SELECT Account,
Alias,
Company,
date,
Json
FROM @inputData
WHERE @referenceDate == DateTime.MinValue OR (date >= @dateFrom AND date <= @dateTo);
Если у вас есть 1 миллион файлов, и ваш фильтр предназначен для самых последних файлов, например 5 файлов, он извлечет только 5 файлов. Затем вы можете подтвердить это на графике работы u- sql, сколько файлов было извлечено.