Во-первых, загрузка документов требует времени или их анализ в Python, когда они у вас есть? Лучше измерить. Если он загружается, вы мало что можете сделать, если исходные API не предоставляют способ запрашивать только часть документов.
Если синтаксический анализ является узким местом, вам все равно придется анализировать часть JSON do c без разбора), но вы можете попробовать перейти к парсеру, отличному от Python, только для этой части задачи, например, вызвав командную строку jq через подпроцесс .