C # HTMLNode получить правильно innerText из div - PullRequest
0 голосов
/ 31 марта 2019

Я пытаюсь правильно извлечь innerText из списка div, который я получаю с веб-сайта.

Это то, что я придумал, но все еще немного глючит, поскольку пропускает пробелы и символ -.

var first = mainmenuTitles[x].Descendants("div").FirstOrDefault(o => o.GetAttributeValue("class", "") == "left").Elements("a").ToList();
string final = "";
foreach (var countfirst in first)
   {
       final += countfirst.InnerText;
   }
Console.WriteLine("Tittle: " + final);

Вот так выглядит HTML-код

<div class="row row-tall mt4"> 
    <div class="clear"> 
    <div class="left"> 
    <a href="/soccer/italy/">
        <strong>Italy</strong>
    </a>
    - 
    <a href="/soccer/italy/lega-pro-group-b/">Serie C:: group B</a> 
</div> <div class="right fs11"> March 31 </div> </div> </div>

Текст, который я пытаюсь получить, должен выглядеть следующим образом -> Италия - серия C :: группа B

Я не гуру HTML, так что простите, если это слишком просто, и я скучаю по нему.

...