Как НЛП рассчитывает общую оценку настроения документа? Я вижу этот вопрос о величине Google Cloud Natural Language API - Как рассчитывается величина документа? , и в вопросе упоминается, что оценка является средней оценкой предложений. Похоже, что это не так в моем примере.
Это новостная статья
text = "В воскресенье шесть человек получили ранения, когда полиция выпустила резиновые пули, чтобы прекратить столкновения Полиция сообщила, что между жителями Южной Африки и Зимбабве в неформальном поселении лачуг под Йоханнесбургом было сожжено сорок четыре лачуги, а в столкновениях были разграблены еще 124, сообщила пресс-секретарь полиции Бетти Нгобени. убит в неофициальном поселении Зандспрут. Жители полагают, что виноват был человек из Зимбабве, сказала она. С тех пор южноафриканцы напали на ряд зимбабвийцев, которые сказали им вернуться в свою страну. По словам Нгобени, африканцы якобы сожгли и разграбили дома зимбабвийцев. Полиция была вызвана и выпустила резиновые пули для разгона толпы, сказала она. Двадцать человек были арестованы и будут обвинены в публичном насилии. Ксенофобия c att acks - обычное явление в Южной Африке, где местные жители обвиняют иностранцев в преступлениях и устраивают скудные рабочие места. "
НЛП API дает мне следующие предложения (содержание, смещение и оценка, указанная ниже)
- "content:" В воскресенье шесть человек получили ранения, когда полиция выпустила резиновые пули, чтобы разжечь столкновения между жителями Южной Африки и Зимбабве в неформальном поселении лачуг возле Йоханнесбурга, сообщили в полиции. Сгорело семьдесят четыре лачуги. еще 124 были разграблены в столкновениях, сказала пресс-секретарь полиции Бетти Нгобени. ": -0.699999988079071
- содержание:" Конфликт возник в прошлом месяце, когда южноафриканская женщина была убита в неофициальном поселении Зандспруит ". begin_offset: 311 : -0.20000000298023224
- содержание: «Жители полагают, что виноват был зимбабвиец, - сказала она. С тех пор южноафриканцы напали на ряд зимбабвийцев, которые сказали им вернуться в свою страну. В воскресенье боевые действия усилились, и толпа По словам Нгобени, южноафриканцы сожгли и разграбили дома зимбабвийцев. Полиция была вызвана и выпустила резиновые пули для разгона толпы, сказала она. "begin_offset: 426: -0.800000011920929
- содержание:" Двадцать человек были арестованы и будут обвинены в публичном c насилии. Атаки ксенофобии c являются обычным явлением в Южной Африке, где местные жители обвиняют иностранцев в преступлениях и занимают мало места. "begin_offset: 810: -0.5
Как видите, сумма / счет составляет -2.2000000029802322 / 4, что составляет в среднем -0,5500000007450581. Но тот же документ дает мне общий балл: -0.6000000238418579
Мне любопытно понять, как рассчитывается оценка настроения всего документа.
Интересно, что величина также не является абсолютной суммой. В этом примере для каждого предложения, приведенного выше, мои величины составляют 0,699999988079071, 0,20000000298023224, 0,800000011920929, 0,5, что похоже на результат без знака, а абсолютная сумма равна 2.2000000029802322, тогда как общая оценка документа составляет 2,400000095367431