Работа с текстами требует очень надежных обучающих данных, которые хорошо маркированы.Неважно, что вы используете.Единственным плюсом использования нейронных сетей является то, что он способен лучше расшифровать отношения между словами, чем другие.Такие библиотеки, как Stanford CoreNLP
, будут работать лучше из-за помеченных данных, которым они подвергаются.Документация sentimentR
обеспечивает сравнение с Stanford CoreNLP
, ссылкой .
Что касается точности, то это больше о том, насколько хорошо вы предварительно обработали свой текст перед использованием любой библиотеки.Все эти шаги относятся к вашему набору данных, например, к списку stopwords
, чтобы вы не потеряли важные слова перед передачей в библиотеку.