Я пытаюсь выполнить синтаксический анализ в Java и использую Cobra HTML Parser, чтобы получить HTML-код в DOM, а затем использую XPath, чтобы получить нужные мне узлы. Когда я опускаюсь до нужного уровня, я вызываю node.getTextContents (), но это дает мне строку типа
"\n\n\nValue\n-\nValue\n\n\n"
Есть ли встроенный способ избавиться от разрывов строки? Я хотел бы сделать RegEx, как
(?:\s*([^-]+)\s*-\s*([^-]+)\s*)
на внутреннем тексте и действительно предпочел бы не иметь дело с возможными различными символами пробела между текстом.
Пример ввода:
Value
-
Value
Спасибо