Таким образом, здесь важна пара вещей
Ма cie может обрабатывать только определенные типы файлов и определенные форматы сжатия
Если указать S3-контейнеры, которые включают файлы формат, который не поддерживается в Ma cie, Ma cie не классифицирует их.
Форматы сжатия https://docs.aws.amazon.com/macie/latest/userguide/macie-compression-archive-formats.html
Зашифрованные объекты Ma cie могут обрабатывать только определенные типы зашифрованных объектов Amazon S3. Для получения дополнительной информации см. Следующую ссылку: https://docs.aws.amazon.com/macie/latest/userguide/macie-integration.html#macie -encrypted- для объектов
Ma cie Limits
Ma cie установлен предел по умолчанию для количества данных, которые он может классифицировать в аккаунте. После достижения этого предела данных Ma cie прекращает классификацию данных. Предел классификации данных по умолчанию составляет 3 ТБ. Это может быть увеличено, если требуется. Механизм классификации контента
Ma cie обрабатывает до первых 20 МБ объекта S3.
Так, в частности, при сжатии дампа но в подходящем формате внутри сжатия тогда да Ma cie может классифицировать, но, что важно, он классифицирует только первые 20 МБ файла, что является проблемой, если файл большой.
Обычно я использую лямбду, чтобы разбить большой файл на файлы размером до 20 МБ. Вам все еще нужно подумать, если у вас есть X файлов, как вы берете запись из файла, который был классифицирован как PII, и отображаете его обратно во что-то пригодное для использования.