Используя эту ссылку http://www.yellowpages.ca/search/?stype=si&what=sh&where=Ottawa,+ON&x=0&y=0 и сообщая HtmlAgilityPack, что нужно одновременно получать и адрес, и название места ("// span [@ class = 'ListingsTitle'] | // div [@ class = 'address' ] / text () [normalize-space (.)] "), я могу получить список названий мест и адресов, подобных этому, в richtextbox:
- JH ryder Machinery Limited
- удобное хранилище, ООО 3344 Rideau
- й, Глостер, вкл, k1g3n4
- кухонные интерьеры 146-я колоннада,
- nepean, on, k2e7y1
Первая строка плохая, у нее нет адреса. Строки 2 и 4 хороши, у них есть адреса. Итак, что я мог сделать, это:
Проверьте каждую строку,
, если следующая строка не содержит «цифры + ВКЛ.», Затем удалить строку.
Это оставит меня с PlaceNames, за которым следуют адреса, которые я затем разделю через каждые две строки в новое текстовое поле (поэтому у меня есть одно текстовое поле с именами мест, а другое с адресами).
Надеюсь, я ясно дал понять.
-dd