Я ищу для извлечения данных таблицы из URL ниже. В частности, я хотел бы извлечь данные в первом столбце. Когда я запускаю приведенный ниже код, данные в первом столбце повторяются несколько раз. Как получить значения, отображаемые только один раз, как показано в таблице?
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen('http://www.pythonscraping.com/pages/page3.html').read()
soup = BeautifulSoup(html, 'lxml')
table = soup.find('table',{'id':'giftList'})
rows = table.find_all('tr')
for row in rows:
data = row.find_all('td')
for cell in data:
print(data[0].text)