pandas str.contains () дает неправильные результаты? - PullRequest
0 голосов
/ 31 августа 2018

Например;

pd.Series('ASKING CD.').str.contains('AS')
Out[58]: 
0    True
dtype: bool

pd.Series('ASKING CD.').str.contains('ASG')
Out[59]: 
0    False
dtype: bool

pd.Series('ASKING CD.').str.contains('SK.')
Out[60]: 
0    True
dtype: bool

Почему третий вывод верен? Там нет "SK." последовательность в переданной строке. 'точка' символ ничего не значит?

1 Ответ

0 голосов
/ 31 августа 2018

Regex . означает совпадение с любым символом. Solutions is escape . или добавить параметр regex=False:

print(pd.Series('ASKING CD.').str.contains(r'SK\.'))
0    False
dtype: bool

print(pd.Series('ASKING CD.').str.contains('SK.', regex=False))
0    False
dtype: bool
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...