Amazon Ma cie для чтения данных базы данных - PullRequest
0 голосов
/ 07 апреля 2020

Я делаю немного PO C в Amazon Macie. Я получил из документации, что он идентифицирует PII данные, такие как кредитные карты. Даже я запустил пример, где я положил несколько действительных номеров кредитных карт в CSV и положил в S3 корзину и был идентифицирован как Macie. Я хочу знать, находятся ли те же самые данные PII в каком-либо файле резервной копии / дампа базы данных, который находится в S3 корзине. Сможет ли Macie идентифицировать? Я ничего не получил в документации, поэтому искал здесь помощь.

1 Ответ

1 голос
/ 07 апреля 2020

Таким образом, здесь важна пара вещей

Ма cie может обрабатывать только определенные типы файлов и определенные форматы сжатия

Если указать S3-контейнеры, которые включают файлы формат, который не поддерживается в Ma cie, Ma cie не классифицирует их.

Форматы сжатия https://docs.aws.amazon.com/macie/latest/userguide/macie-compression-archive-formats.html

Зашифрованные объекты Ma cie могут обрабатывать только определенные типы зашифрованных объектов Amazon S3. Для получения дополнительной информации см. Следующую ссылку: https://docs.aws.amazon.com/macie/latest/userguide/macie-integration.html#macie -encrypted- для объектов

Ma cie Limits

Ma cie установлен предел по умолчанию для количества данных, которые он может классифицировать в аккаунте. После достижения этого предела данных Ma cie прекращает классификацию данных. Предел классификации данных по умолчанию составляет 3 ТБ. Это может быть увеличено, если требуется. Механизм классификации контента

Ma cie обрабатывает до первых 20 МБ объекта S3.

Так, в частности, при сжатии дампа но в подходящем формате внутри сжатия тогда да Ma cie может классифицировать, но, что важно, он классифицирует только первые 20 МБ файла, что является проблемой, если файл большой.

Обычно я использую лямбду, чтобы разбить большой файл на файлы размером до 20 МБ. Вам все еще нужно подумать, если у вас есть X файлов, как вы берете запись из файла, который был классифицирован как PII, и отображаете его обратно во что-то пригодное для использования.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...