Я строю сиамскую сеть для задачи обучения метрике, используя функцию контрастных потерь, и я не уверен, как установить гиперпараметр «маржи» для потерь.
Мои входные данные для функции потерь в настоящее время представляют собой плотные вложения размером 1024 из слоя RNN. Влияет ли размерность этого входа на то, как я выбираю запас?Должен ли я использовать плотный слой, чтобы сначала спроецировать его в пространство меньшего размера?Любые указатели о том, как выбрать конкретную величину маржи (или любое соответствующее исследование), будут очень благодарны!В случае, если это имеет значение, я использую PyTorch.