Преобразование показателя обнаружения языка CLD2 в точность CLD3 - PullRequest
0 голосов
/ 15 марта 2019

Моя cld2 модель определения языка (langID) возвращает входное предложение для классификации следующих значений

{ reliable: true,
  textBytes: 181,
  languages: 
   [ { name: 'ITALIAN', code: 'it', percent: 61, score: 774 },
     { name: 'ENGLISH', code: 'en', percent: 38, score: 1573 } ],
  chunks: 
   [ { name: 'ITALIAN', code: 'it', offset: 0, bytes: 116 },
     { name: 'ENGLISH', code: 'en', offset: 116, bytes: 71 } ] }

, где textBytes представляет размер входного текста, percent распределение code в предложении, тогда как score является показателем качества обнаружения (чем меньше значение лучше всего это). Тем не менее, в новой нейронной сети CLD3 результатом классификации является только точность (так что значение вероятности находится в диапазоне от 0 до 1), например

 println(ld.getCode(0))
 println(ld.getScore(0))

en
0.99

Я хотел бы выяснить, как преобразовать оценку CLD2 в значения вероятностей, чтобы сравнить результаты с новой моделью CLD3.

...