Если мы проверяем domain
, мы должны найти домен 100% соответствия, а не использовать строку. поскольку subdomain
может содержать тот же ключ, что и домен
import tldextract
s=df.url.map(lambda x : tldextract.extract(x).domain).isin(['url1','url2'])
Out[594]:
0 True
1 True
2 True
3 False
4 True
Name: url, dtype: bool
df=df[~s]