У меня есть следующий код, который я пытаюсь получить все в столбце GE C и поместить его в список. В приведенном ниже коде можно захватить первый, который называется «AF», и я могу продолжать добавлять find_next('tr')
, чтобы захватить следующие, но мне сложно понять, как создать al oop в этом сценарии с красивым супом.
import json
from bs4 import BeautifulSoup
import html
from urllib.request import urlopen
from functools import reduce
import pandas as pd
url = 'https://www.cia.gov/library/publications/the-world-factbook/appendix/appendix-d.html'
page = urlopen(url)
soup = BeautifulSoup(page,'html.parser')
soup.find('tr', {'class', 'appendix-entry ln-a'}).find_next('td').find_next('td').get_text(strip = True)