Все что угодно возможно ™
"В форме контейнеров" очень неясно.«Контейнеры» означают множество вещей - контейнеры YARN, контейнеры Docker и т. Д. *
В первую очередь стоит попробовать Hive, PrestoDB или Livy (Spark).С каждым из них будет проще создать запрос через REST API.
В качестве альтернативы, вместо запуска сканирования файловой системы, вы можете хранить данные по-другому.Например, HBase или Accumulo или Ignite.
Однако, если вы хотите действительно быстрый поиск, вам действительно нужно проиндексировать указанные данные.Solr или Elasticsearch - два популярных варианта, оба из которых предоставляют REST API для поиска данных в явном виде