найти ссылку с несколькими ключевыми словами в C # с HTML Agility Pack - PullRequest
0 голосов
/ 22 мая 2018

Я пишу программу, которая анализирует веб-сайт.

Мне удалось найти ссылку на веб-сайте, но мне нужно было передать точные Innertext слова, чтобы найти ее.

Я ищу способ сделать то же самое, но найти его по частичному внутреннему тексту

пример:

  • innertext: "привет, меня зовут"

Я хочу быть в состоянии найти его, поставив только

  • "привет мой"

        foreach (var title in htmlNodes)
        {
            if (keywords == title.SelectSingleNode("div/h1").InnerText)
            {
                if (color == title.SelectSingleNode("div/p").InnerText)
                {
                    Console.WriteLine(title.SelectSingleNode("div/p/a").GetAttributeValue("href", "pas d'addresse"));
                }
            }
        }
    

здесь ключевые слова должны точно соответствовать внутреннему тексту в div / h1.Я хочу, чтобы это было частично.

вот HTML-код:

<article>
    <div class="inner-article">
        <a style = "height:150px;" href="/shop/shirts/c712g63kx/p1us9bkh7">
            <img width = "150" height="150" src="//assets.supremenewyork.com/146319/vi/qW2Nur88W30.jpg" alt="Qw2nur88w30">
        </a>
        <h1>
            <a class="name-link" href="/shop/shirts/c712g63kx/p1us9bkh7">Tiger Stripe Rayon Shirt</a>
        </h1>
        <p>
             <a class="name-link" href="/shop/shirts/c712g63kx/p1us9bkh7">Teal</a>
        </p>
    </div>
</article>

спасибо всем за ваши ответы!

1 Ответ

0 голосов
/ 22 мая 2018

Я узнал, как решить мою проблему.Это было на самом деле довольно просто.вот код:

if ((title.SelectSingleNode("div/h1").InnerText).Contains(keywords))

Теперь проблема в том, чтобы сделать это без учета регистра.

...