Я пытаюсь заполнить значения nan с помощью столбца по столбцу подразделения по группам в кадре данных panda ...........
Я использовал это:
import pandas as pd
dataFrame = pd.read_csv("rainfall in india 1901-2015.csv")
df=dataFrame.groupby("SUBDIVISION").transform(lambda x:x.fillna(x.mean()))
но отсутствовал столбец SUBDIVISION в df ...... Как я могу решить эту проблему?
а также попытался использовать это:
df2=dataFrame.groupby('SUBDIVISION').apply(lambda x: x.fillna(x.mean()))
, но он заменяет значения индекса значениями столбца Подразделение.
Я не очень разбираюсь в лямбде .....
мой dataFrame (он содержит NAN) выглядит следующим образом
SUBDIVISION YEAR JAN ... Mar-May Jun-Sep Oct-Dec
0 ANDAMAN & NICOBAR ISLANDS 1901 49.2 ... 560.3 1696.3 980.3
1 ANDAMAN & NICOBAR ISLANDS 1902 0.0 ... 458.3 2185.9 716.7
2 ANDAMAN & NICOBAR ISLANDS 1903 12.7 ... 236.1 1874.0 690.6
3 ANDAMAN & NICOBAR ISLANDS 1904 9.4 ... 506.9 1977.6 571.0
my df (значение NAN заменено на среднее, но столбец SUBDIVISION не указан) выглядит как
YEAR JAN FEB ... Mar-May Jun-Sep Oct-Dec
0 1901 49.2 87.1 ... 560.300000 1696.3 980.300000
1 1902 0.0 159.8 ... 458.300000 2185.9 716.700000
2 1903 12.7 144.0 ... 236.100000 1874.0 690.600000
3 1904 9.4 14.7 ... 506.900000
df2 выглядит
в области df (NAN заменено на среднее, но есть дополнительное подразделение столбца) есть столбец groupby ...
SUBDIVISION ...
ANDAMAN & NICOBAR ISLANDS 0 ...
1 ...
2 ...
3 ...
4 ...
5 ...
6 ...
please help me thanks in advance
мне нужен df2 в качестве ответа, но мне нужно удалить этот столбец в области индекса