Во-первых, мне нужно заявить о профессиональной заинтересованности: я работаю в IBM, у которой есть инструменты, которые делают именно это.
Шаг 1. Убедитесь, что вы идентифицируете все PII (Личная информация). При совместном использовании информации базы данных обычно встречаются очевидные имена столбцов, такие как «имя», но вам также необходимо найти «скрытые» данные, в которых либо данные встроены в стандартном формате, например строка-имя-строка и имя столбца - это нечто как "код ссылки" или в текстовых полях свободного формата. как вы уже видели, это не будет легкой работой, если вы не автоматизируете ее. Инструмент для этого - InfoSphere Discovery
Шаг 2. В каком контексте должны находиться «очищенные» данные. При изменении именованных полей на случайные символы возникают проблемы при тестировании, поскольку пользователи фокусируются на текстовых ошибках, а не на функциональных сбоях, поэтому изменяют имена на реальные, но вымышленные. Информация о кредитной карте часто должна быть «действительной». под этим я подразумеваю, что он должен иметь действительный префикс, скажем, 49XX, а остальные - недопустимую последовательность. Наконец, вы должны убедиться, что каждый экземпляр изменения распространяется через базу данных для обеспечения согласованности. Инструментом для этого является Optim Test Data Management с опцией конфиденциальности данных.
Два инструмента объединяются, чтобы обеспечить полное решение для конфиденциальности данных.