Как кодировать метки в нескольких фреймах данных панд? - PullRequest
0 голосов
/ 03 октября 2019

У меня есть 2 кадра данных df1 и df2

, оба имеют 3 столбца:

c1, c2, c3

, но в столбце c3 df1 у меня есть следующие уникальные метки:

l1, l2, l3, l4

И в столбце c3 df2 у меня есть эти уникальные метки:

l2, l3, l4, l5

Я хочу закодировать эти метки, чтобы значения последнего столбца df1 стали такими:

1, 2, 3, 4

и df2:

2, 3, 4, 5

Таким образом, кодированные метки должны иметь одинаковое имя в обоих кадрах данных. Метки не в порядке. И необычные метки могут быть больше 1.

1 Ответ

0 голосов
/ 03 октября 2019

Используйте следующую команду:

>>> df1
   c3
0  l1
1  l2
2  l3
3  l4
>>> df1["c3"].apply(lambda x: x[-1])
0    1
1    2
2    3
3    4

Примените это также к df2:

>>> df1["c3"].apply(lambda x: x[-1])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...