В моей работе apache-beam я называю внешний источник, GCP Storage, это можно рассматривать как вызов http для универсальных целей, важной частью является то, что это внешний вызов для обогащения работы.
Каждый фрагмент данных, который я обрабатываю, я называю этим API, чтобы получить некоторую информацию для обогащения данных.В API имеется большое количество повторных обращений к одним и тем же данным.
Существует ли хороший способ кэшировать или сохранять результаты для повторного использования для каждого фрагмента данных, обрабатываемого для ограничения объема требуемого сетевого трафика.Это массивное узкое место для обработки.