Получить все данные таблицы tr в одном HtmlNodeCollection c # - PullRequest
0 голосов
/ 13 сентября 2018

Мне нужно извлечь все tr из всех таблиц с помощью HTML Agility Pack.

HTML:

<section class="content-section" id="more">
    <div class="row">
        <div class="col-xs-6"></div>
        <div class="col-xs-6">
            <h2>Specs</h2>
            <div>
                <div>
                    <table>
                        <thead>
                            <tr><th colspan="2"> test</th></tr>
                        </thead>
                        <tbody>                         
                            <tr><td>2</td><td>b</td></tr>
                            <tr><td>1</td><td>a</td></tr>
                        </tbody>
                    </table>                                    
                    <table>
                        <tbody>
                            <tr><td>3</td><td>c</td></tr>
                            <tr><td>4</td><td>d</td></tr>               
                        </tbody>
                    </table>
                </div>              
            </div>
        </div>      
    </div>  
</section>

C #:

HtmlNodeCollection featuresNode = document.DocumentNode.SelectNodes("//*[@id='more']/div/div[2]/div/div[1]/table/tbody/tr");

Я могу получить только первую таблицу tr, но не могу получить все две таблицы tr в HtmlNodeCollection.

1 Ответ

0 голосов
/ 13 сентября 2018

Чтобы получить все tr узлы, включая один в thead, обновите свой XPath до:

"//*[@id='more']/div/div[2]/div/div[1]/table//tr"

Этот упрощенный XPath также должен работать:

"//*[@id='more']//tr"

Если вы хотите использовать только tr из tbody, используйте:

"//*[@id='more']//tbody//tr"

Или, исключая tr из thead, используйте:

"//*[@id='more']//tr[not(ancestor::thead)]"
...