Мне нужен текст 'td', но он выдает ошибку. Кроме того, у меня нет тега <a>(я хочу удалить его полностью, только хочу, чтобы текст, содержащийся в нем) - PullRequest
0 голосов
/ 02 апреля 2020

Я хочу получить имена из таблицы и сохранить их в списке. https://www.in.pampers.com/pregnancy/baby-names/article/top-indian-baby-names

Однако я не могу получить текст. Он возвращает 'NoneType' object has not attribute 'text'

https://www.in.pampers.com/pregnancy/baby-names/article/top-indian-baby-names

Кроме того, я не хочу, чтобы тег привязки был включен в список имен. Я просто хочу текст тега привязки.

from bs4 import BeautifulSoup
import requests
import lxml

web_page = requests.get("https://www.in.pampers.com/pregnancy/baby-names/article/top-indian-baby-names")

# if requests.status_code == 200:
bs = BeautifulSoup(web_page.text, 'lxml')

tables = bs.findAll("table")

for table in tables:
  for row in table.findAll("tr"):
    print(row.find('td').text)

1 Ответ

0 голосов
/ 02 апреля 2020
import pandas as pd

df = pd.read_html(
    "https://www.in.pampers.com/pregnancy/baby-names/article/top-indian-baby-names")

names = []
for item in df:
    names.extend(item['Name'].to_list())

print(names)

Выход:

['Aaradhya', 'Adah', 'Adhira', 'Alisha', 'Amoli', 'Anaisha', 'Ananya', 'Anika', 'Anushka', 'Asmee', 'Avni', 'Carina', 'Drishti', 'Hiya', 'Ira', 'Ishana', 'Ishita', 'Kaia', 'Kashvi', 'Keya', 'Kimaya', 'Krisha', 'Larisa', 'Mahika', 'Mayra', 'Mehar', 'Mirai', 'Mishka', 'Naitee', 'Navya', 'Nehrika', 'Neysa', 'Pavati', 'Prisha', 'Ryka', 'Rebecca', 'Saanvi', 'Sahana', 'Sai', 'Saisha', 'Saloni', 'Shanaya', 'Shrishti', 'Sneha', 'Taahira', 'Taara', 'Tanvi', 'Viti', 'Zara', 'Aahva', 'Aadiv', 'Aarav', 'Akanksh', 'Alex', 'Anant', 'Atiksh', 'Ayaan', 'Bhuv', 'Dasya', 'Gian', 'Hem', 'Idhant', 'Ishank', 'Jash', 'Jay', 'Joseph', 'Kabir', 'Kahaan', 'Kairav', 'Kevin', 'Laksh', 'Luv', 'Manan', 'Mohammad', 'Naksh', 'Nimit', 'Nirav', 'Pahal', 'Parv', 'Pranay', 'Rachit', 'Raj', 'Ranbir', 'Raunak', 'Reyansh', 'Rishaan', 'Rishit', 'Rohan', 'Rudra', 
'Rushil', 'Sadhil', 'Sarthak', 'Taarush', 'Taksh', 'Ved', 'Vihaan', 'Vivaan', 'Yash', 'Yug', 'Zuber']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...