Дорожная карта CoreNLP - PullRequest
0 голосов
/ 19 мая 2019

Дорожная карта для CoreNLP неясна.Это в режиме обслуживания?Я рад видеть акцент на StanfordNLP, но нехватка видимости в направлении вызывает беспокойство.Если новые нейронные модели будут лучше, увидим ли мы их в Java CoreNLP API?

1 Ответ

0 голосов
/ 20 мая 2019

CoreNLP еще не находится в режиме обслуживания.Мы собираемся внести некоторые довольно существенные (и нарушающие совместимость) изменения в течение лета.Помимо прочего, мы собираемся перейти на использование UDv2 (из текущей версии UDv1), мы собираемся внести изменения токенизации в английский и, возможно, в другие языки, чтобы лучше соответствовать UD и «новым» (примерно с 2004 года!)Токенизация Penn Treebank, и у нас будет более постоянная доступность и использование векторов слов.Эти изменения должны повысить совместимость между пакетами Java и Python, а также со временем позволят нам использовать больше данных для обучения моделей Python stanfordnlp.Теперь, когда Python stanfordnlp v0.2 вышел, работа над CoreNLP должна начаться.

С другой стороны, большая часть исследовательской энергии в группе Stanford NLP теперь перешла на исследование нейронных моделей, построенных в Python навершина основных структур глубокого обучения.(Надеюсь, это не удивительно, чтобы услышать!) Поэтому менее вероятно, что основные новые компоненты будут добавлены в CoreNLP.Сложно предсказать будущее, но разумно ожидать, что CoreNLP будет больше ориентироваться на то, чтобы стать стабильным, эффективным NLP-пакетом на процессоре, а не чем-то, реализующим последние нейронные модели.

...