У меня есть html-файл со встроенным xml-кодом, исходный код вставлен в lastbin:
<html>
<head>
<title> test֤</title>
</head>
<body>
<form name="acsForm" action="" method="post" >
<textarea rows=10 cols=80 name="xmlText"><?xml version="1.0" encoding="UTF-8"?>
<samlp:Response xmlns:samlp="urn:oasis:names:tc:SAML:2.0:protocol">
</samlp:Response>
</textarea>
<textarea name="2nd"> text2....</textarea>
</form>
</body>
</html>
Моя задача - извлечь из HTML текст, заключенный в первый textarea
, который является фрагментом XML. Без каких-либо изменений в оригинальном фрагменте. Я могу получить его с помощью BeautifulSoup, но он меняет все имена тегов в нижний регистр.