Моя цель - очистить комиксы в порядке дня недели и сохранить их в таблице данных Excel. Мой источник https://comic.naver.com/webtoon/weekday.nhn.
Мне удалось очистить данные непосредственно через терминал, и я хотел бы написать подходящий сценарий для всего процесса, но не добился большого успеха.
прямая очистка данных через терминал с помощью response.xpath("//div[@class='list_area daily_all']/div[1]/div/h4/span/text()").extract()
даст правильные данные. Будние дни заказываются из div [1 ~ 7], и этот код возвращает «понедельник».
Следующий код возвращает список комиксов по понедельникам.
response.xpath("//div[@class='list_area daily_all']/div[1]/div//ul/li/a[@class='title']/text()").extract()
Однако следующий код не возвращает желаемых результатов.
def parse(self, response):
for webtoon in response.xpath("//div[@class='list_area daily_all']/div/div"):
yield {
'Day': webtoon.xpath('/h4/span/text()').extract(),
'Title': webtoon.xpath("/ul/li/a[@class='title']/text()").extract(),
}
Ожидаемый результат будет 7 строк следующего кода в порядке дня недели
{'Day': [day], 'Title': [title1, title2, title3]}
Однако мой код возвращается
{'Day': [], 'Title': []}
Надеюсь, все это имеет смысл.