Как создать файл JSON из очищенных данных HTML - PullRequest
0 голосов
/ 24 марта 2020

Я хочу очистить таблицу HTML и сохранить ее в файле JSON. Я успешно очистил данные таблицы html, но не могу понять, как сохранить данные в файле JSON.

Вот мой код:

import requests  
from bs4 import BeautifulSoup  

r = requests.get('url')

soup = BeautifulSoup(r.text, 'html.parser')
resultset = soup.find_all('table', attrs={'style':'font-weight:bold'})
records = []  
for result in resultset:  
    heading = result.find('tr')
    records.append((heading))
print(heading)

Я получаю HTML данные таблицы в форме:

<table>
    <thead>
        <tr>
            <th>Serial Number</th>
            <th>Name</th>
            <th>number1</th>
            <th>number2</th>
            <th>number3</th>
            <th>number4</th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <td>1</td>
            <td>John</td>
            <td>22</td>
            <td>4</td>
            <td>12</td>
            <td>18</td>
        </tr>
        <tr>
            <td>1</td>
            <td>Chris</td>
            <td>26</td>
            <td>6</td>
            <td>10</td>
            <td>1</td>
        </tr>
    </tbody>
</table>

Как можно сохранить эти данные таблицы HTML в файле JSON. Требуемый JSON формат:

[
 {
   "Serial Number": 1,
   "Name": "John",
   "number1": 22,
   "number2": 4,
   "number3": 12,
   "number4": 18
 },
 {
   "Serial Number": 1,
   "Name": "Chris",
   "number1": 26,
   "number2": 6,
   "number3": 10,
   "number4": 1
 }
]

1 Ответ

1 голос
/ 24 марта 2020

Смотри html это разновидность xml, у вас есть xml парсеры, попробуйте один из них. В качестве подсказки я даю вам этот сайт: https://www.codespeedy.com/how-to-convert-xml-to-json-in-python/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...