Python найти данные в строке таблицы - PullRequest
0 голосов
/ 22 марта 2020

Допустим, у меня есть таблица html с 10 столбцами и 100 строками. Все, что я хочу сделать, - это использовать Beautifulsoup для поиска данных при выходе и печати полной строки.

import urllib3
from bs4 import BeautifulSou
http = urllib3.PoolManager()
url "https://en.wikipedia.org/wiki/List_of_Asian_countries_by_area"
response = http.request('GET', url)
soup = BeautifulSoup(response.data, "html.parser")

for tr in soup.find_all('tr')[2:]:
    tds = tr.find_all('td')
    print(tds)

1 Ответ

0 голосов
/ 22 марта 2020

Редактировать:

import urllib3
import re
from bs4 import BeautifulSoup

def searchTableForCountry(country):
    outlist = []
    http = urllib3.PoolManager()
    url = "https://en.wikipedia.org/wiki/List_of_Asian_countries_by_area"
    response = http.request('GET', url)
    soup = BeautifulSoup(response.data, "html.parser")

    for td in soup.find_all('tr'):
          if(len(td.find_all('a', {'href': re.compile(r'/wiki/' + country)})) >=1):
                outlist.append(td.text.replace('\n',' ').replace('\xa0',' '))
                print(''.join(outlist))
    return outlist

searchTableForCountry('China')
#2   China  9,596,961  excludes Hong Kong, Macau, Taiwan and disputed areas/islands 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...