Допустим, у меня есть df
, где в определенном столбце пропущены значения на 50%.
Как можно отбросить, скажем, 10% строк, в которых отсутствуют значения по отношению к столбцу?
Как я могу уменьшить процент пропущенных значений столбца с 50% до 40%?
Ввод (пропущено 50% значений (6/12)):
0
0 1.0
1 1.0
2 NaN
3 NaN
4 NaN
5 1.0
6 NaN
7 1.0
8 NaN
9 1.0
10 NaN
11 1.0
Вывод (40% значений отсутствуют (4/10)): мы отбросили последние 2 строки NaN с идентификаторами 8 и 10
0
0 1.0
1 1.0
2 NaN
3 NaN
4 NaN
5 1.0
6 NaN
7 1.0
9 1.0
11 1.0