Извините, если это вопрос новичка.Я гуглил в течение часа, и я также проверил несколько вопросов на этом сайте, но я не могу понять это.
Я пытаюсь извлечь все теги (элементы) HTML с нескольких разных страниц.Мне не нужны данные между тегами HTML.Мне нужны только используемые теги, комментарии и т. Д.
Так что вывод, который я ищу, - это то, что находится между <>, я думаю.Например, если код
<head> title </head>
<body id=“body text”> blah blah blah </body>
, я хотел бы, чтобы вывод был:
<head> </head>
<body id=“body text”> </body>
Большое спасибо заранее и извините, если это глупый вопрос.