Как очистить сайт Shopify с помощью красивого супа и получить все теги (#) - PullRequest
0 голосов
/ 17 октября 2018

Я пытаюсь найти все элементы # на определенной веб-странице с помощью Beautiful Soup.

source = "https://www.runinrabbit.com/"

def getPageContents(source):

    req = requests.get(source)
    print("req : ",req,type(req))
    print("***************************")
    content = Soup(req.text, 'html.parser')
    print("content data",type(content),content)
    return content

Как и контент, я только получаювсе остальное, кроме значения тега.

Например, строки с тегами, как показано ниже, не печатаются в моей функции: getPageContents.

# marathoner, #winner, #runinrabbit, #topoathletic, #hartfordmarathon, #rabbitpro, #marathon, #olympictrials, #runnergirl, #winning, #finisher, #run, #running, #runner, #runnersofinstagram, #runnersworld, #runnerscommunity, #breezyback, #lightweight, #simp#runinrabbit, #borntorunfree, #breezyback, #lightweight, #simple, #runinrabbit, #borntorunfree ", #racerollcall, #racetime, #runfast, #goodluck, #RADrabbit, #rabbitELITE, #rabbitELITEtrail, #rabbitPRO, #runborntorunfree "

...