Я создал паука, который проверяет сайт бронирования фильма, открыт ли фильм для бронирования. Проверяет каждые 10 секунд. Но проблема, с которой я сталкиваюсь, заключается в том, что даже при открытии бронирования на веб-сайте мой код не получает обновленный веб-сайт, а использует старые данные.
например:
Я удалил сайт, и фильм «А» не открыт для бронирования в 8 утра. Бронирование на фильм «А» открывается в 12 вечера, но паук показывает, что оно не открыто для бронирования. Следует отметить, что я использую неопределенный цикл while, поэтому я запустил программу с 8 утра и никогда не останавливался.
Код:
# -*- coding: utf-8 -*-
import scrapy
from scrapy.http import Request
import threading
import time
import datetime
import winsound
class NewFilmSpiderSpider(scrapy.Spider):
name = 'new_film_spider'
allowed_domains = ['www.spicinemas.in']
start_urls = ['https://www.spicinemas.in/coimbatore/now-showing']
def parse(self, response):
t = threading.Thread(self.getDetails(response))
t.start()
def getDetails(self, response):
while True:
records = response.xpath('//section[@class="main-section"]/section[2]/section[@class="movie__listing now-showing"]/ul/li/div/dl/dt/a/text()').extract()
if 'NGK' in str(records):
try:
print("Booking Opened",datetime.datetime.now())
winsound.PlaySound('alert.wav', winsound.SND_FILENAME)
except Exception:
print ("Error: unable to play sound")
else:
print("Booking Not Opened",datetime.datetime.now())
time.sleep(10)
Если вы запустите код сейчас, он говорит, что бронирование открыто. но мне нужно, чтобы веб-страница отбрасывалась при каждом цикле while. Как я могу это сделать?
Обновление № 1:
Я получаю эти следы при запуске с использованием решения, указанного ниже
File "C:\Users\ranji\Documents\Spiders\SpiCinemasSpider\spicinemas_spider\spiders\new_film_spider.py", line 34, in <module>
main()
File "C:\Users\ranji\Documents\Spiders\SpiCinemasSpider\spicinemas_spider\spiders\new_film_spider.py", line 30, in main
process.start()
File "C:\Users\ranji\AppData\Local\Programs\Python\Python37-32\lib\site-packages\scrapy\crawler.py", line 293, in start
reactor.run(installSignalHandlers=False) # blocking call
File "C:\Users\ranji\AppData\Local\Programs\Python\Python37-32\lib\site-packages\twisted\internet\base.py", line 1271, in run
self.startRunning(installSignalHandlers=installSignalHandlers)
File "C:\Users\ranji\AppData\Local\Programs\Python\Python37-32\lib\site-packages\twisted\internet\base.py", line 1251, in startRunning
ReactorBase.startRunning(self)
File "C:\Users\ranji\AppData\Local\Programs\Python\Python37-32\lib\site-packages\twisted\internet\base.py", line 754, in startRunning
raise error.ReactorNotRestartable()
twisted.internet.error.ReactorNotRestartable