следующий паук создает пустой XML-файл при запуске вместо того, который содержит необходимые элементы, вы можете обнаружить ошибку (ы)?
Обратите внимание, что я абсолютный любитель, поэтому использование бритвы Оккама может быть самым простым решением.
Код паука в arakaali.py:
import scrapy
from PoExtractor.items import PoextractorItem
class RedditSpider(scrapy.Spider):
name = "arakaali"
start_urls = [
"https://pathofexile.gamepedia.com/Araku_Tiki"
]
def parse(self, response):
item = PoextractorItem()
item["item_name"] = selector.xpath("//*[@id='mw-content-text']/span/span[1]/span[1]/text()[1]").extract()
item["flavor_text"] = selector.xpath("//*[@id='mw-content-text']/span/span[1]/span[2]/span[3])").extract()
yield item
Код items.py:
import scrapy
class PoextractorItem(scrapy.Item):
flavor_text = scrapy.Field()
item_name = scrapy.Field()
pass
Затем я использую команду scrapy crawl arakaali
, но в результате получается пустой документ.
Страница, с которой я пытаюсь извлечь данные: https://pathofexile.gamepedia.com/Araku_Tiki
Заранее спасибо за любую помощь.