Здесь можно использовать пересечение set
и понимание списка, которое будет быстрее, чем строковые методы pandas
:
check = set('ae')
df.assign(letters=[set(n.lower()) & check for n in df.Name])
Name Age letters
0 Alexa 10 {a, e}
1 Bob 12 {}
2 Clarke 13 {a, e}
Альтернативой может быть что-то вроде:
df.assign(letters=df.Name.str.findall(r'(?i)(a|e)'))
Name Age letters
0 Alexa 10 [A, e, a]
1 Bob 12 []
2 Clarke 13 [a, e]
Второй подход A) будет включать дубликаты, а B) будет медленнее:
In [89]: df = pd.concat([df]*1000)
In [90]: %timeit df.Name.str.findall(r'(?i)(a|e)')
2.34 ms ± 93.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
In [91]: %timeit [set(n.lower()) & check for n in df.Name]
1.45 ms ± 23.3 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)