У меня есть нейронная сеть в тензорном потоке для классической оценки канала, которую я хочу сжать.Эта сеть представляет собой простую полностью шумоподавляющую сеть, состоящую из десяти слоев и входов 48x1 и выходов 48x1.Эта сеть легко решает классическую проблему x = H * y со среднеквадратичной ошибкой, где x известен и помещается в NN (может рассматриваться как данные изображения), а y должен быть оптимальным результатом (может рассматриваться как метка, которая подходитконкретный х).Таким образом, NN должен решить y с как можно меньшим значением mse (когда вводится x).(Надеюсь, это понятно, иначе дайте мне знать).
У меня есть сеть, обученная TF, с оптимизатором = 'rmsprop', loss = 'mse'.Мой график тренировок выглядит следующим образом с 2000 учебными образцами;
epochs=100,batch_size=32_1_1
epochs=100,batch_size=32_2_1
epochs=100,batch_size=32_4_1
epochs=100,batch_size=32_8_1
epochs=100,batch_size=32_16_1
Теперь я хочу знать, возможно ли сжимать эту сеть с моим набором данных с помощью PocketFlow Framework?https://pocketflow.github.io/
Я прочитал раздел «Модели с самоопределением».Отсюда легко определить файл «Определение сети» (так как моя модель сделана в TF. Но я думаю, что мне следует изменить функцию потерь? Как это особенно касается softmax для CNN? (Я использую только mse для минимизации различий).между x и y). А как насчет точности? Я никогда не использовал такое измерение. Как я должен изменить функцию setup_lrn_rate, чтобы иметь такое же обучение, как указано выше?
Кроме того, «определение сети» не выглядитизменить тоже сложно. Я загрузил свои данные, затем проанализировал их как массивы (и x, и y одинаковы). Но теперь начинается сложная часть. Во-первых, у меня нет классов ... Более того,Как мне выбрать тренировочные образцы, проверочные образцы и оценочные образцы? Ранее я тренировался только с 2000 выборками. Кроме того, как мне выбрать batch_size и batch_size_eval? Я всегда использовал 1000 выборок, чтобы делать прогноз. Нужно ли менять больше вещей??
На данный момент, если сделали выше, и он работает без каких-либо ошибок. Но потеря выглядитполностью отличается от того, что я имел в TF.Так что я действительно не знаю, правильно ли измеряется производительность, и если даже правильно применяется внутри системы для изменения всех весов и смещений?А может быть, даже невозможно использовать эту платформу с другими наборами данных, кроме распознавания объектов в изображениях?
Надеюсь услышать кого-либо.