Я пытаюсь очистить некоторые результаты поиска из этого регистра компании, но когда я пытаюсь очистить название компании, мои результаты не возвращаются должным образом, это похоже на то, что элемент названия компании разделен на 2 элемента HTML на основе ключевого слова поиска. .
Есть ли способ объединить их? Это мой паук
import scrapy
class QuotesSpider(scrapy.Spider):
name = 'gov2'
start_urls = ['https://beta.companieshouse.gov.uk/search/companies?q=a']
def parse(self, response):
for i in response.css('ul.results-list'):
yield {
'company_name': i.css('li.type-company h3 a::text').extract(),
'address': i.css('li.type-company p::text').extract(),
}
Мои результаты, как вы можете видеть, отсутствуют некоторые части .. 
Надеюсь, кто-нибудь из вас увидит, что происходит .. спасибо!