Как разделить текст или абзац на предложения, используя Stanford parser ?
Существует ли какой-либо метод, который может извлекать предложения, например getSentencesFromString(), поскольку он предоставляется для Ruby ?
getSentencesFromString()
Вы можете использовать препроцессор документов .Это действительно легко.Просто введите имя файла.
for (List<HasWord> sentence : new DocumentPreprocessor(pathto/filename.txt)) { //sentence is a list of words in a sentence }
использовать регулярное выражение для разделения текста на предложения, используется Regex, но в Java я не знаю.
код
строка [] предложений = Regex.Split (текст, @ "(? <= ['" "A-za-z] [\)] [\. \! \?]) \ S + (? = [AZ ]) "); </p>
90% работ