Я получаю некоторые данные из мыльного API, который возвращает данные в формате html / xml с большим количеством информации о формате содержимого: например, "</span></span></span>\
" "
"
Я знаю, что обычно разработчик может использовать некоторый API, который извлекает данные json непосредственно с веб-сайта, но этот мыльный API, который возвращает данные html / xml, является единственным API, который у меня есть.
Так как же я могу удалить всю информацию о «формате» и оставить только реальный контент? В идеале я хочу перенести его из html / xml в json, любой пакет python3, который я могу использовать и как?