Я не уверен, как вы хотите вывод. Это работает, так как возвращает элемент, который имеет этот табличный тег. Вам все равно нужно пройти через это, чтобы получить теги tr и td.
Другой вариант, поскольку у него есть тег <table>
, просто используйте Pandas и затем манипулируйте кадрами данных, чтобы извлечь то, что вы хотите, и в нужном вам формате. Вероятно, не в том виде, в котором я хотел бы, но получает данные, и вы можете работать с ними оттуда:
import pandas as pd
url = 'http://www.veikkausliiga.com/tilastot/2016/veikkausliiga/ottelut/498251/kokoonpanot/'
tables = pd.read_html(url)
results = pd.DataFrame()
ix_list = [2,3,4,5,7,8,9,10]
for ix in ix_list:
results = results.append(tables[ix])
results = results.reset_index(drop=True)
Выход:
print (results)
0 ... 3
0 #21 T. Dähne ... NaN
1 #15 V. Jalasto ... #3 Taiwo
2 #20 Vincent ... NaN
3 #7 N. Alho ... NaN
4 #25 D. Assis ... NaN
5 #9 B. Span ... #11 J. Ibrahim
6 #4 P. Sparrdal Mantilla ... #7 T. Wirtanen
7 #1 W. Viitala ... NaN
[8 rows x 4 columns]