Как я вижу, в большинстве примеров в сетях с триплетными потерями, в конце концов, добавляется лямбда-слой, чтобы как бы сжать получившиеся кластеры в гиперсферу. Кто-нибудь может объяснить, почему это делается и каковы преимущества этого подхода? Заранее спасибо.