Меня смутила цель аннотации englishPCFG Model и Penn treebank, пакет Standford Parser включал только все виды моделей, меня всегда спрашивает, как работает эта модель, если у нас уже есть аннотация от Peen treebank. Проще говоря, что такое Peen Treebank Annaotation для Parser и как выходит модель? если для синтаксического анализатора приходит необработанный текст, нужно ли запрашивать Treebank для прогнозирования деревьев agian?
Я читаю некоторые материалы, но до сих пор не знаю, когда генерировалась модель на следующих этапах.
1, выберите доступный банк деревьев.
2. Выберите механизм синтаксического анализа, подходящий для аннотации treebank.
3, выберите данные обучения и испытаний.
4, Тренируйте парсер на тренировочном наборе.
5. Оцените точность анализатора на тестовом наборе.
6, Написать отчет по проекту с экспериментальными результатами.
Кто-нибудь может помочь?