Я пытаюсь извлечь отзывы о товарах по таким URL-адресам, как этот
https://www.namastevaporizers.com/products/mighty-vaporizer
Паук, который у меня есть, извлекает что-нибудь на странице, но ничего из комментариев, я думаю, это потому, что комментарии загружаются по-разному, но, к сожалению, на этом мои знания о лоскутках заканчиваются. Кто-нибудь может мне помочь с этим?
вот мой паук
import scrapy
from scrapy.loader import ItemLoader
from scrapy.loader.processors import TakeFirst, MapCompose
from scrapy.spiders import Spider
from Namaste.items import NPPItem
class NPP(Spider):
name = 'Product_Pages'
start_urls = ['https://www.namastevaporizers.com/products/mighty-vaporizer'
def parse(self, response):
item_loader = ItemLoader(item=NPPItem(), response=response)
item_loader.add_css("Z_reviews", "div.yotpo-user-name") # gets nothing
item_loader.add_css("Z_reviews", "div.content-title") # gets nothing
item_loader.add_css("Z_reviews", "div.content-review") # gets nothing
item_loader.add_css("Z_reviews", "div.yotpo") # gets some data but missing most stuff, this is the entire yotpo content wrapper
item_loader.add_value("AAE_source_url", response.url) #works fine
return item_loader.load_item()