Я загрузил своего паука на scrapyhub .Я понимаю, как загрузить файл * .txt, но как его использовать?
Мой setup.py файл выглядит как
setup(
name = 'project',
version = '1.0',
packages = find_packages(),
package_data={
'youtube_crawl': ['resources/Names.txt']
},
entry_points = {'scrapy': ['settings = youtube_crawl.settings']},
)
Тогда я хочу использовать этот Name.txt .
перед загрузкой мой паук выглядит так:
def parse(self, response):
with open('resources/Names.txt','rt') as f:
for link in f:
url = "https://www.youtube.com/results?search_query={}".format(link)
name = link.replace('+',' ')
yield Request(url, meta={'name':name}, callback=self.parse_page, dont_filter=True)
Итак, мой вопрос: как я могу использовать свой файл на скребке?
Я пробовал этот код, но непонять, как это работает и как интегрировать его с моим кодом =)
data = pkgutil.get_data("youtube_crawl", "resources/Names.txt")
Функция возвращает двоичную строку, которая является содержимым указанного ресурса.