Я пытаюсь добавить новый столбец в фрейм данных только с уникальными значениями из существующего столбца.В новом столбце будет меньше строк со значениями np.nan, где были бы дубликаты.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':[1,2,3,4,5], 'b':[3,4,3,4,5]})
df
a b
0 1 3
1 2 4
2 3 3
3 4 4
4 5 5
Цель:
a b c
0 1 3 3
1 2 4 4
2 3 3 nan
3 4 4 nan
4 5 5 5
Я пробовал:
df['c'] = np.where(df['b'].unique(), df['b'], np.nan)
Бросает: operands could not be broadcast together with shapes (3,) (5,) ()