Все алгоритмы машинного обучения берут реальные изображения и преобразуют изображения в тензорные и обрабатывают их в пакетном режиме (несколько изображений одновременно).
Пара вариантов для вас:
- Вы можете делиться своими изображениями с товарищами по команде и передавать их в доверительное управление.
- Вы можете каким-то образом запутывать изображения в виде набора файлов или создавать алгоритм для преобразования их в массив (или тензор), обфусцироватьих, и предоставьте процедуру, чтобы вернуть их обратно без потерь.
Но во всех этих случаях нежелательные люди могут каким-то образом угадать вашу процедуру / запутывание.
Идеальным было бы создатьмодель машинного обучения (например, VGG, ResNet, Inception) из ваших изображений, а затем вы можете распространять свою модель, которая узнала, что вы спланировали из ваших изображений.
Итог, в ML вам нужны изображения, чтобы чему-то научитьсяих, а не изображения как таковые.
Конфиденциальность действительно является проблемой, как мы видим из этого документа , касающегосяИменно поэтому авторское право вызывает ухудшение в общедоступных наборах данных.
Существует не так много решений этой проблемы, потому что конфиденциальность действительно имеет значение.Однако эта идея с GAN может быть обнадеживающей.
Если вы не используете GAN, трудно сказать, какой будет правильный набор преобразований, которые вы должны предпринять, чтобы избежать проблем политики конфиденциальности.
Недостаточно просто попытаться перевернуть изображения, масштабировать их, удалить метаданные, нормализовать их или преобразовать один пиксель.Вам нужно сделать их неотличимыми от оригиналов.