Внедрение символов слишком близко, как отладить или улучшить? - PullRequest
0 голосов
/ 13 апреля 2020

Я работаю над проблемой подобия фраз, для которой я тренирую модель, основанную на встраивании символов (в основном, тип elmo) в сиамскую сеть. Однако, принимая сходство выходных векторов, все слишком близко (отклонение сходства в моих данных составляет приблизительно 0,00002). Мой набор данных сильно искажен, около 25: 1 (neg: pos), но я взвесил потерю, чтобы позаботиться об этом. Я также удостоверился, что мои сплиты поезда / val / test стратифицированы.

Любые идеи о том, как отладить это / где я могу пойти не так?

Спасибо!

...