Я пытаюсь создать поток в Apache-Nifi для сбора файлов из стороннего RESTful APi, и я установил свой поток следующим образом:
InvokeHTTP - ExtractText - PutFile
Я могу собрать файл, который мне нужен, поскольку я указал это в своем удаленном URL, однако, когда я получаю все данные из указанного файла, он выводит несколько (100) одинаковых файлов на мой выходкаталог.
3 вещи, в которых мне нужна помощь:
1: Как получить поток для вывода файла в читаемом .csv, а не просто в файле без ext
2: Как я могу остановить процессор, когда у меня есть все данные, которые мне нужны
3: Файл Json, который мне был предоставлен, дает мне возможность получать файлы из определенного диапазона дат:
https://api.3rdParty.com/reports/v1/scheduledReports/877800/1553731200000
Или я могу выбрать определенный файл:
https://api.3rdParty.com/reports/v1/scheduledReports/download/877800/201904/CTDDaily/2019-04-02T01:50:00Z.csv
Но как я могу создать команду в Nifi для автоматической проверки новых файлов, так как этот процесс будет выполняться ежедневно, и мы будемсмотреть на загрузку нового файла каждый день.
Если это слишком широко, пожалуйста, помогите мне, дайте мне знать, чтобы я мог редактировать этот пост.
Спасибо.
Примечание: имя хоста 3rdParty было переименовано для обеспечения безопасности - поэтому ссылки не будут работать напрямую.Благодарю.