извлечение текста после определенного значения в пандах - PullRequest
0 голосов
/ 02 мая 2018

Я пытаюсь извлечь значения в столбце с текстовыми данными, как показано ниже:

create date:1953/01/01 | first author:REAGAN RL

Как извлечь имя автора из столбцов и сохранить в новом столбце. Я пробовал следующие способы:

df.str.extract("first author:(.*?)")

и

authorname=df['EntrezUID'].apply(lambda x:x.split("first author:")). Второй работал.

Как я могу использовать выражения regualr для достижения аналогичной вещи

1 Ответ

0 голосов
/ 02 мая 2018

Вы можете сделать:

## sample data
df = pd.DataFrame({'dd':['create date:1953/01/01 | first author:REAGAN RL','create date:1953/01/01 | first author:MEGAN RL']})

## output
df['names'] = df['dd'].str.extract(r'author\:(.*)')

print(df)
                                                dd      names
0  create date:1953/01/01 | first author:REAGAN RL  REAGAN RL
1   create date:1953/01/01 | first author:MEGAN RL   MEGAN RL
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...