Я хочу использовать регулярные выражения для извлечения некоторых полей из элемента, но ничего не совпадает.
это код трубопровода:
class AuthoridPipeline(object):
def process_item(self,item,spider):
if item['author_id']:
item['author_id'] = re.search('[1-9][0-9]{4,}',item['author_id'])
else:
return DropItem('抛弃')
Для сравнения необходимо указать первое число цифр.в элементе URL (URL) демо https://zhaoqiansun.com/13404366/
Результат совпадения пуст