Как предотвратить перекрестную проверку информации из нескольких графиков? - PullRequest
0 голосов
/ 06 мая 2019

Я создаю информационную панель с помощью Plotly & Dash. Мы работаем с конфиденциальными данными, но нам также нужны интерактивные функции Plotly & Dash.

Понятно, что Figure Plotly хранит необработанные данные, это цена интерактивности. Однако это может быть потенциальной проблемой конфиденциальности, поскольку любой человек, имеющий доступ к панели мониторинга, может получить необработанные данные из нескольких графиков (скажем, одномерные распределения) и перестроить набор данных столбец за столбцом.

Что мы делаем в данный момент, так это перемешиваем строки перед построением Figure.

Например:

traces = [
    go.Box(
        x = df["Age"].sample(frac=1)
    )
]

go.Figure(data=traces, layout={})

При таком крошечном хаке невозможно перегруппировать необработанные данные из возраста распределения возраста в другой график (например, почтовый индекс), но это утомительно и легко забыть. Мы считаем, что должен быть лучший способ сделать это.

Похоже, что можно использовать предварительно вычисленную статистику для сюжетов бокса . Мы могли бы также использовать что-то вроде Datashader для точечных диаграмм, чтобы «скрыть» истинные значения.

К сожалению, эти решения не охватывают достаточно случаев использования.

Кто-нибудь сталкивается с той же проблемой? Как вы работаете с конфиденциальными данными в Plotly?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...