Настройте Spacy NER, используя схему тегов IOB для набора данных Movie Review - PullRequest
0 голосов
/ 27 мая 2018

Ранее я использовал модель CRF ++ для идентификации NER в наборе данных обзора фильмов.Тем не менее, я обнаружил, что Spacy очень эффективен в использовании и визуализации.Тем не менее, вопрос здесь заключается в том, как я могу включить модель CRF ++ в пространстве?Если это невозможно, как я могу обучить модель Spacy NER для своего требования с использованием тегов IOB?

1 Ответ

0 голосов
/ 29 мая 2018

Модель spaCy основана на специально разработанной модели CNN, которую лучше всего оценивать здесь .Таким образом, у него нет внутренней модели CRF, но, используя собственный конвейер, вы можете использовать свою собственную модель CRF с spaCy, проверьте this для получения подробной информации.

Для обучения модели NER с использованием spaCyВаши данные должны быть в формате BILUO , поэтому сначала необходимо преобразовать данные, а затем выполнить превосходный документ об этом .Для этого также есть конвертер:

python -m spacy convert [input_file] [output_dir] [--converter] [--n-sents]
[--morphology]

, который можно использовать для преобразования данных с conll и ion в формат spaCy.

...