Я успешно обучил Spacy распознавать некоторые именованные объекты.
Допустим, модель успешно распознает компании (ORG) и фрукты (FRUIT).
Я хотел бы получить вероятность того, что слово будет для каждого из этих объектов. Что-то вроде:
doc = nlp("Apple to ship highest number of new iPhones this fall")
print(getProbabilities(doc))
// [
// (0,0, 'Apple', [ ['ORG', 0.99], ['FRUIT', 0.01] ])
// ]
doc = nlp("Apple picking machine provides potential future of agriculture")
print(getProbabilities(doc))
// [
// (0,0, 'Apple', [ ['FRUIT', 0.99], ['ORG', 0.01] ])
// ]
Используя описанную технику здесь Я могу получить оценку определенного именованного объекта, но только наиболее вероятный, а не другие.