CoreNLP еще не находится в режиме обслуживания.Мы собираемся внести некоторые довольно существенные (и нарушающие совместимость) изменения в течение лета.Помимо прочего, мы собираемся перейти на использование UDv2 (из текущей версии UDv1), мы собираемся внести изменения токенизации в английский и, возможно, в другие языки, чтобы лучше соответствовать UD и «новым» (примерно с 2004 года!)Токенизация Penn Treebank, и у нас будет более постоянная доступность и использование векторов слов.Эти изменения должны повысить совместимость между пакетами Java и Python, а также со временем позволят нам использовать больше данных для обучения моделей Python stanfordnlp.Теперь, когда Python stanfordnlp v0.2 вышел, работа над CoreNLP должна начаться.
С другой стороны, большая часть исследовательской энергии в группе Stanford NLP теперь перешла на исследование нейронных моделей, построенных в Python навершина основных структур глубокого обучения.(Надеюсь, это не удивительно, чтобы услышать!) Поэтому менее вероятно, что основные новые компоненты будут добавлены в CoreNLP.Сложно предсказать будущее, но разумно ожидать, что CoreNLP будет больше ориентироваться на то, чтобы стать стабильным, эффективным NLP-пакетом на процессоре, а не чем-то, реализующим последние нейронные модели.