Мне нужно обработать XML-файлы, которые содержат потенциально большой (до 2 ГБ) контент.В этих файлах «большая» часть контента распространяется не на весь файл, а содержится в одном элементе (зашифрованный файл, закодированный в шестнадцатеричном формате).
У меня нет рычагов воздействия на источник файлов, поэтомуМне нужно разобраться с этой ситуацией.
Требуется сохранить небольшой отпечаток памяти (<500 МБ).Я смог прочитать и обработать содержимое файла в потоковом режиме, используя <a href="https://docs.python.org/3/library/xml.sax.html" rel="nofollow noreferrer"> xml.sax , который отлично справляется со своей работой.
Проблема в том, что эти файлы также должны быть проверены на соответствиеопределение схемы XML (файл .xsd), которое, похоже, не поддерживается xml.sax.
Я нашел несколько современных библиотек для проверки схемы, таких как xmlschema , но ни одной для выполнения проверкив потоковом / ленивом виде.
Кто-нибудь может порекомендовать способ сделать это?