Предположим, у нас есть набор изображений и меток, предназначенных для задачи классификации машинного обучения. Проблема в том, что эти изображения имеют относительно короткую политику хранения. В то время как можно обучить модель в режиме онлайн (т.е. обновлять ее новыми данными об изображениях каждый день), я в идеале заинтересован в решении, которое каким-то образом может сохранить изображения для обучения и тестирования.
Для этого мне интересно, существуют ли какие-либо известные методы, например, какое-то одностороннее хеширование изображений, которое запутывает изображение, но все же допускает использование методов глубокого обучения.
Я не эксперт по этому вопросу, но я думаю об этом следующим образом: у нас есть NxN
изображение I
(скажем, 1024x1024
) со значениями пикселей в P:={0,1,...,255}^3
и однонаправленная хеш-карта f(I):P^(NxN) -> S
. Затем, когда мы обучаем сверточную нейронную сеть на I
, мы сначала отображаем сверточные фильтры через f
, чтобы затем тренироваться в многомерном пространстве S. Я думаю, что нет необходимости в f
для локальной чувствительности, в этих пикселях рядом друг с другом не нужно отображать значения в S рядом друг с другом, если мы знаем, как сопоставить сверточные фильтры с S. Обратите внимание, что обязательно, что f
не является обратимым, и что результирующее сохраненное изображение в S
до неузнаваемости.
Один из вариантов для f,S
- использовать сверточную нейронную сеть на I
, чтобы затем извлечь представление I
из его полностью связанного слоя. Это не идеально, потому что есть большая вероятность того, что эта сеть не сохранит более тонкие функции, необходимые для задачи классификации. Так что я думаю, что это исключает CNN или автоматический кодировщик для f
.