Как исключить определенные сайты из поиска Google в python? - PullRequest
1 голос
/ 28 февраля 2020

Я использую поисковый API Google Марио Виласа, который можно найти на github здесь: https://github.com/MarioVilas/googlesearch

Теперь, во время поиска я хочу удалить определенные сайты из списка , Я прочитал документы, и кажется, что нет ничего, что позволило бы нам исключить определенные домены. Есть ли работа вокруг этого? Если нет, знаете ли вы какие-либо другие API поиска Google, которые могли бы сработать.

Вот мой код:

keyword = input("Keyword: ")
country = input("Country:")
tld_of_country = domain_names[country]



for website in search(keyword, tld=tld_of_country, num=2, 
stop=2, country="canada", pause=2): 
 try:
      links.append(website)
 except:
      continue

1 Ответ

2 голосов
/ 28 февраля 2020

https://support.google.com/gsa/answer/2672318?hl=en

Длина поискового запроса ограничена, поэтому, если вы исключите слишком много доменов, используя: "-website: site", Google не вернет никакого результата. В этой ситуации вы можете исключить вручную из вашего списка, используя RegEx или что-то подобное. Вы можете использовать:

[x for x in yourlist if "domain" not in x]

Или, в вашей ситуации, вы можете добавить оператор if перед процедурой добавления.

...