Извлечение сайтов WordPress из Bing - PullRequest
0 голосов
/ 27 февраля 2019

Я нахожу этот код Python для извлечения WordPress сайтов из Bing, может кто-нибудь объяснить, как этот код фильтрует только WordPress сайты.

try:
lista = []
s = sys.argv[1]
page = 1
print('\n')
while page <= 21:
    bing = "http://www.bing.com/search?q=ip%3A"+s+"+?page_id=&count=50&first="+str(page)
    openbing  = urllib2.urlopen(bing)
    readbing = openbing.read()
    findwebs = re.findall('<h2><a href="(.*?)"' , readbing)
    for i in range(len(findwebs)):
        wpnoclean = findwebs[i]
        findwp = re.findall('(.*?)\?page_id=', wpnoclean)
        lista.extend(findwp)

    page = page + 10

final =  unique(lista)
for wp in final:
    print(wp)

try:
    for i , l in enumerate(final):
        pass
    print '\nSites Found : ' , i + 1
except:
    pass

except IndexError:
    pass

1 Ответ

0 голосов
/ 01 марта 2019

Чего ты пытаешься достичь?Вы хотите создать поисковый опыт, который будет искать только через Wordpress.Если да, используйте API пользовательского поиска Bing: https://azure.microsoft.com/en-us/services/cognitive-services/bing-custom-search/

...