Я пытаюсь очистить этот URL, чтобы получить только определенные индексы. В этом случае, я показал пример, я могу очистить индекс 6, который даст мне любой URL, который начинается с / wiki /. который даст мне все TLD, начинающиеся с буквы A. Я хотел бы получить все индексы, которые я нахожу относящимися к моей задаче.
На данный момент я попытался перечислить их как таковые [6, 7, 8 и т. Д.] И в цитатах. Я не очень много работаю со списками, и мне нужно потратить еще немного времени на изучение.
import requests
from bs4 import BeautifulSoup
page = requests.get('https://en.wikipedia.org/wiki/List_of_Internet_top-level_domains')
soup = BeautifulSoup(page.text, 'lxml')
table = soup.findAll('table')[6]
for record in table.findAll('tr'):
for data in record.findAll('td'):
for link in data.select("a[href^='/wiki/.']"):
links = link.contents[0]
print(links)
Однако, поскольку я новичок в программировании, я не уверен, как добавить несколько индексов помимо 6. Вот ошибки, которые я получаю:
======= RESTART: /run/media/sean/The Continuum/Python/wikinamelist.py =======
Traceback (most recent call last):
File "/run/media/sean/The Continuum/Python/wikinamelist.py", line 7, in <module>
table_data = soup.find_all('table')["6", "7"]
TypeError: list indices must be integers or slices, not tuple
>>>
======= RESTART: /run/media/sean/The Continuum/Python/wikinamelist.py =======
Traceback (most recent call last):
File "/run/media/sean/The Continuum/Python/wikinamelist.py", line 7, in <module>
table_data = soup.find_all('table')[6, 7];
TypeError: list indices must be integers or slices, not tuple
>>>
======= RESTART: /run/media/sean/The Continuum/Python/wikinamelist.py =======
Traceback (most recent call last):
File "/run/media/sean/The Continuum/Python/wikinamelist.py", line 7, in <module>
table_data = soup.find_all('table')[6, 7, 8];
TypeError: list indices must be integers or slices, not tuple
Как вы можете видеть выше, у меня есть несколько методов, которые я попытался показать в сообщении об ошибке.
Любые отзывы будут оценены, спасибо!