Я пытаюсь получить список ссылок в формате PDF с разных сайтов.Сначала я использую класс веб-клиента для загрузки исходного кода страницы.Затем я использую sgmlReader для преобразования HTML в XML.Поэтому для одного конкретного сайта я получу тег, который выглядит следующим образом:
<p><a href="pub/1985_to_1997_Board_Action_Summary.pdf">1985 to 1997 Board Action Summary</a></p>
Мне нужно получить все ссылки, которые содержат «.pdf».Очевидно, что не все сайты имеют одинаковую структуру, поэтому простой поиск тега <p>
не будет достаточно динамичным.Я бы предпочел не использовать linq, но я буду использовать, если придется.Заранее спасибо.