Google NLP API: оценка чувствительности документа! = Средняя (оценка предложения) - PullRequest
0 голосов
/ 11 января 2020

Как НЛП рассчитывает общую оценку настроения документа? Я вижу этот вопрос о величине Google Cloud Natural Language API - Как рассчитывается величина документа? , и в вопросе упоминается, что оценка является средней оценкой предложений. Похоже, что это не так в моем примере.

Это новостная статья

text = "В воскресенье шесть человек получили ранения, когда полиция выпустила резиновые пули, чтобы прекратить столкновения Полиция сообщила, что между жителями Южной Африки и Зимбабве в неформальном поселении лачуг под Йоханнесбургом было сожжено сорок четыре лачуги, а в столкновениях были разграблены еще 124, сообщила пресс-секретарь полиции Бетти Нгобени. убит в неофициальном поселении Зандспрут. Жители полагают, что виноват был человек из Зимбабве, сказала она. С тех пор южноафриканцы напали на ряд зимбабвийцев, которые сказали им вернуться в свою страну. По словам Нгобени, африканцы якобы сожгли и разграбили дома зимбабвийцев. Полиция была вызвана и выпустила резиновые пули для разгона толпы, сказала она. Двадцать человек были арестованы и будут обвинены в публичном насилии. Ксенофобия c att acks - обычное явление в Южной Африке, где местные жители обвиняют иностранцев в преступлениях и устраивают скудные рабочие места. "

НЛП API дает мне следующие предложения (содержание, смещение и оценка, указанная ниже)

  1. "content:" В воскресенье шесть человек получили ранения, когда полиция выпустила резиновые пули, чтобы разжечь столкновения между жителями Южной Африки и Зимбабве в неформальном поселении лачуг возле Йоханнесбурга, сообщили в полиции. Сгорело семьдесят четыре лачуги. еще 124 были разграблены в столкновениях, сказала пресс-секретарь полиции Бетти Нгобени. ": -0.699999988079071
  2. содержание:" Конфликт возник в прошлом месяце, когда южноафриканская женщина была убита в неофициальном поселении Зандспруит ". begin_offset: 311 : -0.20000000298023224
  3. содержание: «Жители полагают, что виноват был зимбабвиец, - сказала она. С тех пор южноафриканцы напали на ряд зимбабвийцев, которые сказали им вернуться в свою страну. В воскресенье боевые действия усилились, и толпа По словам Нгобени, южноафриканцы сожгли и разграбили дома зимбабвийцев. Полиция была вызвана и выпустила резиновые пули для разгона толпы, сказала она. "begin_offset: 426: -0.800000011920929
  4. содержание:" Двадцать человек были арестованы и будут обвинены в публичном c насилии. Атаки ксенофобии c являются обычным явлением в Южной Африке, где местные жители обвиняют иностранцев в преступлениях и занимают мало места. "begin_offset: 810: -0.5

Как видите, сумма / счет составляет -2.2000000029802322 / 4, что составляет в среднем -0,5500000007450581. Но тот же документ дает мне общий балл: -0.6000000238418579

Мне любопытно понять, как рассчитывается оценка настроения всего документа.

Интересно, что величина также не является абсолютной суммой. В этом примере для каждого предложения, приведенного выше, мои величины составляют 0,699999988079071, 0,20000000298023224, 0,800000011920929, 0,5, что похоже на результат без знака, а абсолютная сумма равна 2.2000000029802322, тогда как общая оценка документа составляет 2,400000095367431

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...