У меня есть функция, позволяющая получать все заголовки с моего сайта.
я не хочу получать название от некоторых продуктов
это правильный путь?
я не хочу названия продуктов со словами «OLP NL», «Arcserve», «LicSAPk» или «symantec»
def get_title ( u ):
html = requests.get ( u )
bsObj = BeautifulSoup ( html.content, 'xml' )
title = str ( bsObj.title ).replace ( '<title>', '' ).replace ( '</title>',
'' )
if (title.find ( 'Arcserve' ) or title.find ( 'OLP NL' ) or title.find (
'LicSAPk' ) or title.find (
'Symantec' ) is not -1):
return 'null'
else:
return title
if (title != 'null'):
ws1 [ 'B1' ] = title
meta_desc = get_metaDesc ( u )
ws1 [ 'C1' ] = meta_desc
meta_keyWrds = get_metaKeyWrds ( u )
ws1 [ 'D1' ] = meta_keyWrds
print ( "writing product no." + str ( i ) )
else:
print("skipped product no. " + str ( i ))
continue;
проблема в том, что программа исключает все мои продукты, и все, что я вижу, это «пропущенный продукт №». ?
че? не у всех есть эти слова ...