Как извлечь конкретный контент из столбца данных и сделать новый столбец? - PullRequest
0 голосов
/ 03 декабря 2018

Я хочу создать новый столбец, содержащий названия (например, «Мистер», «Мисс», «Капитан» и т. Д.) Имен, указанных в столбце «Имя» ниже.

train_df['Name'].head()

0                              Braund, Mr. Owen Harris
1    Cumings, Mrs. John Bradley (Florence Briggs Th...
2                               Heikkinen, Miss. Laina
3         Futrelle, Mrs. Jacques Heath (Lily May Peel)
4                             Allen, Mr. William Henry
Name: Name, dtype: object

Можете ли вы объяснитьВышеуказанная задача также с использованием 'pandas.Series.str.extract'?Спасибо.

1 Ответ

0 голосов
/ 03 декабря 2018

Вы можете использовать str.extract:

df['Titles'] = df['Name'].str.extract(r', (\w+\.)')

Возвращает:

                                           Name Titles
0                       Braund, Mr. Owen Harris    Mr.
1  Cumings, Mrs. John Bradley (Florence Briggs)   Mrs.
2                        Heikkinen, Miss. Laina  Miss.
3  Futrelle, Mrs. Jacques Heath (Lily May Peel)   Mrs.
4                      Allen, Mr. William Henry    Mr.

Вы можете увидеть регулярное выражение в действии здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...