pandas извлечение подстроки из столбца - PullRequest
0 голосов
/ 18 июня 2020

Предположим, у меня есть df:

df = pd.DataFrame({'col': ['ABCXDEF', 'ABCYDEF']})

Как я могу извлечь строку, окруженную ABC и первым появлением DEF? Желаемый результат:

    col
0   X
1   Y

Обратите внимание, что мне не нужно решение, основанное на точных позициях, например:

df.col.str[3:4]

1 Ответ

3 голосов
/ 18 июня 2020

(обновление: найдите первое вхождение 'DEF') Используйте это регулярное выражение:

df = pd.DataFrame({'col': ['ABCXDEF', 'ABCYDEFDEFDEF']})
print(df.col.str.extract(r"ABC(.*?)DEF"))

Результат:

   0
0  X
1  Y
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...