Вы можете использовать
s1.str.contains(r'\br[ée]gions?\b').astype(int)
Если вы хотите сохранить регулярное выражение в файле, а затем прочитать и использовать в качестве переменной, просто напишите \br[ée]gions?\b
.
Test:
>>> import pandas as pd
>>> s1 = pd.Series(['here is region', 'my regions', 'régionally', 'région','régions','regions','region'])
>>> s1.str.contains(r'\br[ée]gions?\b').astype(int)
0 1
1 1
2 0
3 1
4 1
5 1
6 1
dtype: int32
Подробности
\b
- граница слова r
- r
char [ée]
- одна из букв в классе символов gion
- gion
s?
- необязательная s
буква \b
- граница слова.