У меня есть фрейм данных, и я хочу выполнить регрессию, но у меня много разных функций, поэтому я хочу выполнить PCA, чтобы уменьшить количество функций. В этом упражнении мои функции - Bname (значения столбцов), и когда я пытаюсь повернуть его по регионам, я получаю много NAN. Есть ли способ исправить это, вместо того, чтобы заполнять NAN 0, мы можем просто удалить это конкретное значение из базы данных и затем выполнить PCA?
Вот как выглядит база данных:
Index Wk Bname Items_sold PricePerUnit Promo Bfamily REGION
0 201503 Mercurial 16 $99.9 1 NIKE
1 201503 Mercurial 10 $129.99 0 NIKE
2 201503 F50 19 $149.99 0 NAN
3
.
.
9999999