заполнение пропущенных значений в панде данных - PullRequest
0 голосов
/ 29 октября 2018

Я пытаюсь заполнить значения nan с помощью столбца по столбцу подразделения по группам в кадре данных panda ........... Я использовал это:

  import pandas as pd 
  dataFrame = pd.read_csv("rainfall in india 1901-2015.csv")
  df=dataFrame.groupby("SUBDIVISION").transform(lambda x:x.fillna(x.mean()))

но отсутствовал столбец SUBDIVISION в df ...... Как я могу решить эту проблему? а также попытался использовать это:

df2=dataFrame.groupby('SUBDIVISION').apply(lambda x: x.fillna(x.mean()))

, но он заменяет значения индекса значениями столбца Подразделение.

Я не очень разбираюсь в лямбде .....
мой dataFrame (он содержит NAN) выглядит следующим образом

                      SUBDIVISION  YEAR    JAN   ...       Mar-May  Jun-Sep  Oct-Dec
  0     ANDAMAN & NICOBAR ISLANDS  1901   49.2   ...       560.3   1696.3    980.3
  1     ANDAMAN & NICOBAR ISLANDS  1902    0.0   ...       458.3   2185.9    716.7
  2     ANDAMAN & NICOBAR ISLANDS  1903   12.7   ...       236.1   1874.0    690.6
  3     ANDAMAN & NICOBAR ISLANDS  1904    9.4   ...       506.9   1977.6    571.0

my df (значение NAN заменено на среднее, но столбец SUBDIVISION не указан) выглядит как

            YEAR    JAN    FEB     ...          Mar-May  Jun-Sep      Oct-Dec
      0     1901   49.2   87.1     ...       560.300000   1696.3   980.300000
      1     1902    0.0  159.8     ...       458.300000   2185.9   716.700000
      2     1903   12.7  144.0     ...       236.100000   1874.0   690.600000
      3     1904    9.4   14.7     ...       506.900000  

df2 выглядит в области df (NAN заменено на среднее, но есть дополнительное подразделение столбца) есть столбец groupby ...

   SUBDIVISION                    ...
   ANDAMAN & NICOBAR ISLANDS 0    ...
                             1    ...
                             2    ...
                             3    ...
                             4    ...
                             5    ...
                             6    ...
 please help me thanks in advance                   

мне нужен df2 в качестве ответа, но мне нужно удалить этот столбец в области индекса

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...