Деидентификация PHI для HIPAA - PullRequest
2 голосов
/ 14 июля 2020

У меня есть база данных SQL, содержащая PHI, размещенная на AWS. Я хочу получить доступ к этим данным для выполнения аналитики, однако я должен сначала деидентифицировать данные, чтобы соответствовать HIPAA.

Как мне подойти к этому? Я придумал несколько подходов:

  1. Просто деидентифицировать БД с помощью SQL команд.
  2. С этого момента каждый раз, когда БД добавлено, добавьте обезличенную версию этих данных в другую базу данных . Затем обратитесь к этой БД для аналитики.
  3. С этого момента каждый раз, когда БД добавляется, добавляйте обезличенную версию этих данных в другую таблицу в этой БД . Затем откройте эту таблицу с помощью SQL команд для аналитики.

Какой подход лучше всего использовать для соблюдения требований HIPAA? Или есть способ лучше?

Спасибо!

1 Ответ

3 голосов
/ 14 июля 2020

Бюджет позволяет, рассмотрите возможность проведения аналитики в другой системе и во время ETL деидентифицируйте данные. Изменение исходной системы в соответствии с этим требованием усложнит обслуживание и, вероятно, повлияет на другие интеграции - может закончиться монолитом.

Есть разные способы сделать это: вы можете сделать AWS DMS (с продолжающейся репликацией) с DB в качестве источника и S3 в качестве цели (формат паркета). Оттуда вы можете использовать Athena для аналитики в качестве выделенного jarmod, который также поддерживает формат паркета, и вы даже можете использовать SQL -подобные запросы в Athena для анализа ваших данных. Также есть Redshift, отправка в другую реляционную БД, другие платформы аналитики и т. Д. c.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...