Ваш вопрос немного неясен.
Наиболее популярные библиотеки для анализа XML и HTML в Python:
Красивый суп - старше, но все еще популярен
lxml - стандарт по умолчанию, если вы можете получить доступ к libxml, где бы вы ни выполняли свой код
Используя эти библиотеки, вы сможете извлечь все, что вам нужно, и вернуть его клиенту.