Berkeley Parser English - разные результаты онлайн против оффлайн - PullRequest
0 голосов
/ 22 октября 2018

Я использую парсер Berkeley для английского языка, с здесь .Кажется, это дает мне результаты, отличные от их онлайн demo .

Например, рассмотрим предложение:

I am a platinum member. I want someone to fix this for me immediately.

Запуск анализатора намоя машина дает мне это дерево разбора (что неверно): enter image description here

При запуске через демонстрацию я получаю это (что правильно): enter image description here

Может кто-нибудь указать, почему здесь есть разница?Загружаемый анализатор содержит только один файл грамматики английского языка, eng_sm6.gr, поэтому он не может быть неправильным файлом грамматики.Может ли это быть проблемой с переключателем командной строки?Это то, что я бегу: java -jar BerkeleyParser-1.7.jar -gr eng_sm6.gr

Любая помощь приветствуется, спасибо!

1 Ответ

0 голосов
/ 22 октября 2018

В связи с этой ситуацией мне приходят на ум две причины:

  • они могли использовать другую грамматику в онлайн-версии
  • они могли бы разделить предложения перед анализом и объединитьпредложения в корневой узел в онлайн-версии

Вы можете заранее разделить предложения, а затем проанализировать предложения по отдельности.Статистические парсеры обучаются с предложениями.Насколько мне известно, Berkeley Parser - это некомплексный синтаксический анализатор, который также обучен предложениям, но может быть сложнее разобрать больше токенов для него.Как вы можете видеть в своих выходных данных, термин немедленно помечен как существительное;так что вы можете сначала попытаться разбить предложения, а затем проанализировать и посмотреть, как они будут развиваться.

Cheers,

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...