Я хочу извлечь текст из th тегов в таблице, чтобы я мог распечатать список станций метро из таблицы на странице Википедии. Мне нужен только текст из определенной таблицы (их на странице два)
import urllib.request
url = "https://en.wikipedia.org/wiki/List_of_London_Underground_stations"
page = urllib.request.urlopen(url)
from bs4 import BeautifulSoup
soup = BeautifulSoup(page, "lxml")
stations_table = soup.find("table", class_= "wikitable sortable plainrowheaders")
stations_table
for i in soup.find_all('th', stations_table):
print(i.text)
Я могу получить таблицу, хранящуюся в переменной stations_table
, но не могу напечатать текст в тегах th
внутри таблица wikitable sortable plainrowheaders
. В то время как он печатает название станции, он также печатает заголовки:
Станция Местные полномочия Зоны (ы) [†] Открыт [4] Основная линия открыта Использование [5]
Как я могу отфильтровать их?