Разделение вопроса и ответа на отдельные строки, например, 1-я строка столбца A1 содержит que 1 1-я строка A2 col catains answer for qes 1 и т. Д. - PullRequest
0 голосов
/ 06 июня 2019

введите описание изображения здесь Я хочу удалить анкету с сайта ниже https://www.sanfoundry.com/python-mcqs-basic-operators/

Формат должен быть таким, чтобы каждый вопрос и ответ отображались в разных столбцах. Если вопрос содержит только текст без каких-либо тегов HTML, это было бы лучше.

Я использовал скрапбуки для удаления этой информации, но проблема, с которой я сталкиваюсь, заключается в том, что все вопросы появляются в одном ряду, а все ответы появляются в другом ряду. Мне нужно, чтобы отображалось: вопрос 1 в одной строке и соответствующий ответ на этот вопрос в другой строке.

import scrapy

class QuestionSpider(scrapy.Spider):

    name = "redbot"

    start_urls = ['https://www.sanfoundry.com/python-mcqs-basic-operators/']

    def parse(self, response):
        #Extracting the content using xpath selectors
        text = [
            ' '.join(
                line.strip() 
                for line in response.css("div > p").extract_first()
                if line.strip()
            ) 
            for p in response.xpath('//p')
        ]

        votes = [
            ' '.join(
                line.strip() 
                for line in response.css(".collapseomatic_content ::text") .extract_first()
                if line.strip()
            ) 
            for p in response.xpath('//div')
        ]


        #Give the extracted content row wise
        for item in zip(text,votes):
            #create a dictionary to store the scraped info
            scraped_info ={
                'texts' : item[0],
                'vote' : item[1]   
            }

            #yield or give the scraped info to scrapy
            yield scraped_info

Мне нужен каждый вопрос и соответствующий ответ в 2 разных строках без тега html с использованием кода scrapy. Пожалуйста, исправьте код, который я предоставил.

...