spaCy is_oov не работает должным образом - PullRequest
0 голосов
/ 08 мая 2018

is_oov не работает для слов, которые я знаю, находятся в словаре. Возможно ли, что этот вариант использования неверен?

import spacy
nlp = spacy.load('en')

doc = nlp('I am sflmgmavknsaccasas dog cat bird bulbasaur')

[tok.is_oov for tok in doc]
[True, True, True, True, True, True, True]
  • spaCy версия: 2.0.9
  • Платформа: OSX 10.13.4
  • Версия Python: 3.6.4
  • Модели: en

1 Ответ

0 голосов
/ 10 мая 2018

Я пытался запустить ваш код, с той разницей, что я использую большую английскую модель и явно указываю путь:

import spacy
nlp = spacy.load('C:\Anaconda3\Lib\site- 
packages\en_core_web_lg\en_core_web_lg-2.0.0')
doc = nlp('I am sflmgmavknsaccasas dog cat bird bulbasaur')
[tok.is_oov for tok in doc]
[False, False, True, False, False, False, False]

Как видите, это работает правильно. Могу ли я предложить вам явно указать путь к английской модели, на случай, если возникнет проблема с символической ссылкой?

...