Разделите имя и фамилию, если в другом столбце есть общее совпадение - PullRequest
0 голосов
/ 17 марта 2020

У меня есть набор данных, подобный

+--------------------------------------------------
|    |entity    |individual_name  |investor_name  |
---------------------------------------------------
|  0 |Null      |Null             | Mark Wurtzel  |
|  1 |entity    |Al Ihne          | Ihne LLC      |
|  2 |entity    |Al Ihne          | Ihne LLC      |
|  3 |entity    |Myles Lewis      | JMFM INC      |
|  4 |entity    |Myles Lewis      | JMFM INC      |
|  4 |entity    |Myles Lewis      | JMFM INC      |
+--------------------------------------------------

Если мои индивидуальное_имя и имя_инвестора совпадают, то сначала принимают имя_инвестора и разделяются на имя_имя и фамилию и isSelf равен 1 и , затем возьмите индивидуальное_имя и разделите на имя_имя и фамилию, а значение isSelf будет равно 0.

и мой фрейм данных будет выглядеть как

+------------------------------------------------------------------------------------------+
|    |entity    |individual_name  |investor_name  | first_name | last_name       | isSelf  |
--------------------------------------------------------------------------------------------
|  0 |Null      |Null             | Mark Wurtzel  |  Mark      | Wurtzel         |     1   |
|  1 |entity    |Al Ihne          | Ihne LLC      |  Ihne      | LLC             |     1   |
|  2 |entity    |Al Ihne          | Ihne LLC      |  AL        | Ihne            |     0   |
|  3 |entity    |Myles Lewis      | JMFM INC      |  JMFM      | INC             |     1   |
|  4 |entity    |Myles Lewis      | JMFM INC      |  Myles     | Lewis           |     0   |
|  5 |entity    |Myles Lewis      | JMFM INC      |  Myles     | Lewis           |     0   |
+------------------------------------------------------------------------------------------+

Заранее спасибо

1 Ответ

0 голосов
/ 17 марта 2020

Отфильтруйте вашу базу данных на основе вашего условия, используя циклы, если условие и метод group_by, доступные в библиотеке pandas, создадут вам новый объект, содержащий только отфильтрованные значения.

Из этого вы можно легко разделить имена с помощью регулярных выражений или некоторых строковых функций.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...