используя обобщенный текст для поиска внутри html исходного кода - PullRequest
0 голосов
/ 22 апреля 2020

Я работаю над небольшим проектом, в котором у меня есть небольшие файлы, которые будут загружаться в мою программу из папки.

Эти файлы будут использоваться для проверки веб-сайтов для пользователя

так, например, я хочу найти пользователя на Reddit, Twitch и других сайтах. Я мог бы использовать этот инструмент, если бы у меня были конфиги для сайтов, на которых я хотел проверить имя пользователя.

def userCheck(link, user, isSuccess):
    link = link.replace("<USERNAME>", user)
    isSuccess = isSuccess.replace("<USERNAME>", user)
    print(isSuccess)
    print(link)
    html = requests.get(link)
    print(html)
    page_source = html.text
    count = page_source.count(isSuccess)
    print(count)
    if count > 0:
        return True
    else:
        return False
    outFile =  open("outputs.txt","w+")
    outFile.write(page_source)
    outFile.close()

print(userCheck("https://reddit.com/u/<USERNAME>", "1r0nk3y", "<h1 class=\"_eYtD2XCVieq6emjKBH3m\"><USERNAME></h1>"))

теоретически, мой код должен смотреть через HTML для переменной isSuccess (заменяется на username) и успешно вернуть true в этом конкретном случае. Да, я знаю, что мог бы работать с кодами ответов, но некоторые сайты дают хороший код для плохого пользователя.

Вот мой вывод:

<h1 class=_eYtD2XCVieq6emjKBH3m>1r0nk3y</h1>
https://reddit.com/u/1r0nk3y
<Response [502]>
0
False

Я считаю, что основная дилемма, с которой я сталкиваюсь здесь я не хочу использовать что-то вроде bs4 для этого. это должно быть намного проще. но если веб-сайту требуется более продвинутое ключевое слово или фраза, чтобы проверить, что это был успешный поиск, мне нужно будет использовать вещи с кавычками

любая помощь будет оценена, спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...