Я тестирую этот базовый пример из документации SpaCy и получаю странные результаты.
import spacy
nlp = spacy.load('en_core_web_md')
tokens = nlp(u'dog cat banana')
for token1 in tokens:
for token2 in tokens:
print(token1.text, token2.text, token1.similarity(token2))
Моя настройка:
- MacBook Pro
- macOS 10.13.4
- Conda 4.5.9
- Python3.5.5
- SpaCy 2.0.12
Ожидаемые результаты:
dog dog 1.0
dog cat 0.80168545
dog banana 0.24327646
cat dog 0.80168545
cat cat 1.0
cat banana 0.2815437
banana dog 0.24327646
banana cat 0.2815437
banana banana 1.0
Мои результаты:
dog dog 1.0
dog cat 0.0
dog banana 0.0
cat dog 0.0
cat cat 1.0
cat banana -0.0446812
banana dog -7.82874e+17
banana cat -8.24222e+17
banana banana 1.0
Я пробовалудаление и повторная установка SpaCy и всех различных моделей и даже самой SpaCy.Я также попробовал еще более простой пример:
import spacy
nlp = spacy.load('en_core_web_md')
cat = nlp(u'cat')
dog = nlp(u'dog')
print(cat.similarity(dog)) # 0.0