Я пытаюсь очистить данные из этой ссылки c: http://onlinecatalogue.kebs.org/. Ссылка не имеет возможности просматривать, поэтому ссылка остается постоянной. Кроме того, поиск по ключевому слову, например, «cat», приводит к таблице, но ссылка http://onlinecatalogue.kebs.org/webquery.dll независимо от того, какое ключевое слово вы используете для поиска. XPath для стола, который нужно почистить, составляет
//*[@id="AutoNumber1"]/tbody/tr[1]/td[2]/table/tbody/tr/td/table[2]/tbody
, что является легкой частью для меня. Но главная проблема заключается в том, как справиться с нумерацией страниц на этом сайте. Буду признателен, если вы укажете мне правильное направление, как я могу справиться с этим.
NB: Я думал о длинном списке ключевых слов, через которые я могу l oop просмотреть и выполнить поиск, а затем сгенерировать таблицу с данными, но, опять же, я не уверен если Scrapy справится с этим.