Я работаю над проблемой подобия фраз, для которой я тренирую модель, основанную на встраивании символов (в основном, тип elmo) в сиамскую сеть. Однако, принимая сходство выходных векторов, все слишком близко (отклонение сходства в моих данных составляет приблизительно 0,00002). Мой набор данных сильно искажен, около 25: 1 (neg: pos), но я взвесил потерю, чтобы позаботиться об этом. Я также удостоверился, что мои сплиты поезда / val / test стратифицированы.
Любые идеи о том, как отладить это / где я могу пойти не так?
Спасибо!