Как удалить целевой блок tr с помощью Beautifulsoup - PullRequest
0 голосов
/ 03 мая 2019

Я хочу удалить целевой блок tr с текстом, когда я его запускаю, у меня получился идеальный вывод, но есть проблема, я видел, что он отменяет <tr><td>Domain</td><td>Last Resolved Date</td></tr> на самом деле я не хочу эту строку в своем выводе, так как я могуудалить. Код ниже

Исправлено

Старый код

import requests
from bs4 import BeautifulSoup


headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
url = "https://viewdns.info/reverseip/?host=github.com&t=1"
text = requests.get(url, headers=headers).text
soup = BeautifulSoup(text, 'html.parser')

table = soup.find('table', attrs={'border':'1'})
domain = table.findAll('td', attrs={'align':None})

for line in domain:
    print(line.text)

Исправлено

import requests
from bs4 import BeautifulSoup


headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
url = "https://viewdns.info/reverseip/?host=github.com&t=1"
text = requests.get(url, headers=headers).text
soup = BeautifulSoup(text, 'html.parser')

table = soup.find('table', attrs={'border':'1'})
domain = table.findAll('td', attrs={'align':None})[2:]

for line in domain:
    print(line.text)

Ответы [ 2 ]

0 голосов
/ 03 мая 2019

Попробуйте код.

import requests
from bs4 import BeautifulSoup


headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
url = "https://viewdns.info/reverseip/?host=github.com&t=1"
text = requests.get(url, headers=headers).text
soup = BeautifulSoup(text, 'html.parser')

table = soup.find('table', attrs={'border':'1'})
domain = table.findAll('td', attrs={'align':None})[2:]

for line in domain:
    print(line.text)
0 голосов
/ 03 мая 2019

Отфильтруйте первые два объекта в вашей переменной domain:

domain = table.findAll('td', attrs={'align':None})<b>[2:]</b>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...