Удалить разрыв строки в htmlagilitypack? - PullRequest
2 голосов
/ 11 сентября 2010

я пытаюсь получить этот текст на веб-странице без разрыва строки:

<span class="listingTitle">888-I-AM-JUNK. Canada's most trusted BIG LOAD junk removal<br />specialist!</span></a>

Как я могу это сделать?

Вот мой текущий код, я использую vb.

Dim content As String = ""
        Dim doc As New HtmlAgilityPack.HtmlDocument()
        doc.Load(WebBrowser1.DocumentStream)
        Dim hnc As HtmlAgilityPack.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//span[@class='listingTitle']")
        For Each link As HtmlAgilityPack.HtmlNode In hnc
            Dim replaceUnwanted As String = ""
            replaceUnwanted = link.InnerText.Replace("&amp;", "&") '
            replaceUnwanted = replaceUnwanted.Replace("&#39;", "'")
            replaceUnwanted = replaceUnwanted.Replace("See full business details", "")

            content &= replaceUnwanted & vbNewLine
        Next
        RichTextBox1.Text = content
        Me.RichTextBox1.Lines = Me.RichTextBox1.Text.Split(New Char() {ControlChars.Lf}, _
                                                   StringSplitOptions.RemoveEmptyEntries)

Мне нужно удалить <br />

1 Ответ

0 голосов
/ 11 сентября 2010

Как насчет того же обычного манипулирования строками?

replaceUnwanted = replaceUnwanted.Replace(vbCrLf, "")

Если вы имели дело с <span>...<span>:

replaceUnwanted = replaceUnwanted.ToLower().Replace("<br>", "")
replaceUnwanted = replaceUnwanted.ToLower().Replace("<br />", "")
...