Моя cld2 модель определения языка (langID) возвращает входное предложение для классификации следующих значений
{ reliable: true,
textBytes: 181,
languages:
[ { name: 'ITALIAN', code: 'it', percent: 61, score: 774 },
{ name: 'ENGLISH', code: 'en', percent: 38, score: 1573 } ],
chunks:
[ { name: 'ITALIAN', code: 'it', offset: 0, bytes: 116 },
{ name: 'ENGLISH', code: 'en', offset: 116, bytes: 71 } ] }
, где textBytes
представляет размер входного текста, percent
распределение code
в предложении, тогда как score
является показателем качества обнаружения (чем меньше значение лучше всего это).
Тем не менее, в новой нейронной сети CLD3 результатом классификации является только точность (так что значение вероятности находится в диапазоне от 0 до 1), например
println(ld.getCode(0))
println(ld.getScore(0))
en
0.99
Я хотел бы выяснить, как преобразовать оценку CLD2 в значения вероятностей, чтобы сравнить результаты с новой моделью CLD3.