Можно ли это сделать, получив весь контент с веб-страницы, используя методы, уже перечисленные выше, а затем с помощью regex до удалить все символы в открытых и закрытых скобках?
Страница, которая выглядит следующим образом:
<html><style> h1 { font-style:... }</style><h1>stuff in here</h1></html>
Стало бы таким после регулярного выражения :
h1 { font-style:... }stuff in here
И поскольку мы хотим удалить всекод между различными тегами, такими как тег [style], затем мы могли бы сначала использовать регулярное выражение для удаления всех символов между [style и / style], так что у нас осталось только:
stuff in here
Было бы этоработать тогда?Пожалуйста, ответьте, если вы считаете, что это произойдет, или если вы предвидите ошибки, поскольку я хотел бы создать инструмент с этим анализом.