Как записать td (данные таблицы) в CSV в одну строку после извлечения таблицы HTML? - PullRequest
0 голосов
/ 28 мая 2019

Я извлекаю HTML-таблицу и пишу в csv. Но не смог написать в требуемом формате webscraping: https://ipr.etsi.org/IPRDetails.aspx?IPRD_ID=2383&IPRD_TYPE_ID=2&MODE=2&sessionkey=53a715

enter image description here

Как мыЯ видел изображение: есть три таблицы, которые я извлекаю с помощью красивого супа, но не могу записать td в требуемом формате. Обязательный формат - одноразовые данные (заголовок таблицы) и данные td в одной строке, как показано на снимке экрана ниже

enter image description here

Как мы видели в первом, втором и третьем столбце, каждая вещь, приходящаяся на один заголовок, а третья колонка под рабочим элементом, идет через запятую, разделенную, как показано на скриншоте.результат необходим.Я не могу сделать. Ниже приведен код

import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup
csvFile = open('Information.csv', 'wt+')
writer = csv.writer(csvFile)
html = urlopen('https://ipr.etsi.org/IPRDetails.aspx?IPRD_ID=2383&IPRD_TYPE_ID=2&MODE=2&sessionkey=53a715')
bs = BeautifulSoup(html, 'html.parser')
table = bs.findAll('table')
for tr in table:
    rows = tr.findAll('tr')
    for row in rows:
        csvRow = [] 
        for cell in row.findAll(['td', 'th']):
            csvRow.append(cell.get_text())
            print(csvRow)
        writer.writerow(csvRow)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...