Я пытаюсь получить список ссылок из поиска Google:
def google_word(word):
headers={'User-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763'}
url = 'https://google.com/search?q={}'.format(word)
res= requests.get(url, headers=headers)
tree= html.fromstring(res.text)
li = tree.xpath("//a[@href]") #list of links that conatin href
y = [link.get('href') for link in li if link.get('href').startswith("https://") if "google" not in link.get('href')]
Теперь этот код собирает правильную ссылку, которая начинается с "https://"
, и я хочу добавить"http://"
также. Что мне нужно добавить к пониманию списка, чтобы сделать эту работу (я пытаюсь сделать это в одной строке)?