Мне нужно разобрать простую HTML-страницу с простой формой в ней.Ответы на аналогичные вопросы в StackOverflow предлагают использовать одну из большого числа нестандартных библиотек Java, таких как TagSoup, JSoup, HTMLParser и многих других.
Однако, веб-поиск показал, что в некоторых стандартных функцияхJava SE через этот класс: http://docs.oracle.com/javase/7/docs/api/javax/swing/text/html/parser/ParserDelegator.html
Мои подвопросы:
- Правда ли, что стандартный класс ParserDelegator может анализировать вариант использования, подобный моему?
- Каковы ограничения стандартной библиотеки, которые создают необходимость в большом количестве нестандартных библиотек?
- Не исключает ли тот факт, что ParserDelegator находится в разгаре, использование его на обычном облачном сервере EC2 для веб-приложения??Придется ли мне прыгать через много обручей, чтобы обойти безголовый аспект, или это будет просто небольшая настройка в конфигурации?
- Если стандартный не рекомендуется, какой нестандартный следует использовать, учитывая: (а) мое желание не отклоняться от стандарта;(б) мой простой вариант использования;(в) стремление к зрелой надежной реализации;и (d) нет ограничений по размеру или весу, поскольку это серверное приложение, а не встроенный клиент.API является гораздо более низким приоритетом, поэтому, хотя я ценю CSS-селектор JSoup, такой как API, другие проблемы (a) - (d) переопределяют его.
Спасибо.