есть ли функция для поиска строки на веб-странице по некоторой процентной разнице - PullRequest
0 голосов
/ 23 апреля 2019

Я пытаюсь найти строку на странице с помощью bs4 lib, и она работает хорошо, но есть ли способ найти строку через процент различий, как в этом примере: у нас есть эта строка: The Eggplant the Witch and the Wardrobe 720p AMZN WEB-DL DD+5 1 H 264-QOQ

и должен найти эту строку: The Eggplant the Witch and the Wardrobe 720p AMZN WEB-DL DD5 1 H264-QOQ

часть моего кода на Python:

from bs4 import BeautifulSoup as Wsoup

x = The Eggplant the Witch and the Wardrobe 720p AMZN WEB-DL DD+5 1 H 264-QOQ
scn_rls_soup = Wsoup(my_driver, "html.parser")  

found = scn_rls_soup.find(text=x)

print(found)

1 Ответ

1 голос
/ 23 апреля 2019

Попробуйте что-то вроде этого:

from bs4 import BeautifulSoup as Wsoup
from difflib import SequenceMatcher

def similar(a, b):
    return SequenceMatcher(None, a, b).ratio()

x = "The Eggplant the Witch and the Wardrobe 720p AMZN WEB-DL DD+5 1 H 264-QOQ"
scn_rls_soup = Wsoup(my_driver, "html.parser")  

found = scn_rls_soup.findAll(text=True)
for text in found:
    if similar(x,text) > 0.8:
        print(text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...