Не каждый веб-сайт хорошо предоставляет свои данные с помощью XML-каналов, API и т. Д.
Как я могу получить информацию с веб-сайта? Например:
...
<div>
<div>
<span id="important-data">information here</span>
</div>
</div>
...
Я пришел из Java-программирования и программирования с использованием Apache XMLBeans. Есть ли что-то похожее на синтаксический анализ HTML, когда я знаю структуру и данные между известным тегом?
Спасибо