Рассмотрим эту простую установку
import pandas as pd
df = pd.DataFrame({'id' : [1,2,3],
'text' : ['stack-overflow',
'slack-overflow',
'smack-over']})
df
Out[9]:
id text
0 1 stack-overflow
1 2 slack-overflow
2 3 smack-over
У меня есть заданное регулярное выражение, и я хотел бы извлечь совпадение longest .Я знаю, что могу использовать str.extractall
, чтобы получить все совпадения, но как я могу получить самый длинный из них (как столбец df['mylongest']
в кадре данных)?
Конечно, в этом примере самыми длинными совпадениями являются переполнение, переполнение и привкус.
df.text.str.findall(r'(\w+)')
Out[10]:
0 [stack, overflow]
1 [slack, overflow]
2 [smack, over]
Name: text, dtype: object