Удаление части HTML на странице HTML - PullRequest
0 голосов
/ 23 января 2019

Я пытаюсь удалить некоторые теги с содержимым при загрузке страницы, чтобы запретить отправку нескольких тегов.

Я работал со строкой поиска, и она не помогает при большом наборе данных.

string startTag = "<section>"+Environment.NewLine+
"                <div id=\"nonPrintable123\">";

        var startIndex = htmlString.IndexOf(startTag);
        var html = htmlString.Substring(0, startIndex) + "</div></form>      </body></html>";

Можно ли как-нибудь использовать Regex и удалить / заменить весь дочерний элемент пустой строкой?

Данные в <Section> {data} </Section> должны быть заменены пустыми или любым другим подавлением.

Ответы [ 2 ]

0 голосов
/ 23 января 2019

Я сделал со следующим фрагментом кода, используя vb.net:

Private Sub removehtml()
    Dim str As String = " <div id=nonPrintable123> <!--#  Start --> hjhjhty iuh  hwjkednjkb dvhv xcaisfdchascjk bkasj df kh <!--End #-->"
    Dim sindex As Integer = 0
    Dim eindex As Integer = 0
    sindex = str.IndexOf("<!--#")
    eindex = str.IndexOf("#-->")
    Dim substr As String = String.Empty
    substr = str.Substring(sindex, (eindex - sindex) + 4)
    str = str.Replace(substr, String.Empty)
End Sub

Таким образом, я удалил все ненужные данные из данной строки

0 голосов
/ 23 января 2019

с использованием String.Replace работал для меня в прошлом.https://docs.microsoft.com/en-us/dotnet/api/system.string.replace?view=netframework-4.7.2

startString &= startString.Replace("<div>HTML you want to replace</div>", "")
...