У меня есть выход, используя BeautifulSoup.
Мне нужно преобразовать вывод из 'type' 'bs4.element.Tag' в список и экспортировать список в столбец DataFrame с именем COLUMN_A
Я хочу, чтобы мой вывод остановился на 14-м элементе (последние три h2
бесполезны)
Мой код:
import requests
from bs4 import BeautifulSoup
url = 'https://www.planetware.com/tourist-attractions-/oslo-n-osl-oslo.htm'
url_get = requests.get(url)
soup = BeautifulSoup(url_get.content, 'html.parser')
attraction_place=soup.find_all('h2', class_="sitename")
for attraction in attraction_place:
print(attraction.text)
type(attraction)
Вывод:
1 Vigeland Sculpture Park
2 Akershus Fortress
3 Viking Ship Museum
4 The National Museum
5 Munch Museum
6 Royal Palace
7 The Museum of Cultural History
8 Fram Museum
9 Holmenkollen Ski Jump and Museum
10 Oslo Cathedral
11 City Hall (Rådhuset)
12 Aker Brygge
13 Natural History Museum & Botanical Gardens
14 Oslo Opera House and Annual Music Festivals
Where to Stay in Oslo for Sightseeing
Tips and Tours: How to Make the Most of Your Visit to Oslo
More Related Articles on PlanetWare.com
Я ожидаю список вроде:
attraction=[Vigeland Sculpture Park, Akershus Fortress, ......]
Большое спасибо заранее.