Модификация ячеек в пандах df не удалась - PullRequest
1 голос
/ 16 октября 2019

Я пытаюсь изменить ячейки в существующем df - если я нахожу строку без буквенных символов (например, таких как "*"), я устанавливаю ее в строку "0.0", и когда все ячейки обрабатываются, я пытаюсь преобразовать столбецчисловой тип. Но установка «0.0» по какой-то причине не отражается в результате df

for i, col in enumerate(cols):
    for ii in range(0, df.shape[0]):
        row = df.iloc[ii]
        value = row[col]

        if isinstance(value, str):
            if not( utils.representsInt(value) or utils.representsFloat(value) ) and re.search('[a-zA-Z]', x) is None:
                df.iat[ii, i] = "0.0"

     df[col] = df[col].astype(np.float_)
    #df[col] = df[col].to_numeric() #this throws error that Series does not have to_numeric()

Я получаю ошибку

could not convert string to float: 'cat'

И когда я печатаю df, я вижу, что значения не изменились. В чем может быть проблема?

Спасибо!

df

f289,f290,f291,f292,f293,f294,f295,f296,f297,f298,f299,f300,f301,f302,f303,f304,f305,f306,f307,f308,f309,f310
01M015,P.S. 015 Roberto Clemente,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M019,P.S. 019 Asher Levy,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M020,P.S. 020 Anna Silver,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M034,P.S. 034 Franklin D. Roosevelt,K-8,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,14
01M063,The STAR Academy - P.S.63,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,6
01M064,P.S. 064 Robert Simon,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M110,P.S. 110 Florence Nightingale,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M134,P.S. 134 Henrietta Szold,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M137,P.S. 137 John L. Bernstein,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M140,P.S. 140 Nathan Straus,K-8,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M142,P.S. 142 Amalia Castro,Elementary,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M184,P.S. 184m Shuang Wen,K-8,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*
01M188,P.S. 188 The Island School,K-8,1.0,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,*,10

Так что, в этом случае, я ожидаю, что у этого df будет "0.0" вместо "* "и эти столбцы должны иметь числовой тип данных, например float после преобразования

1 Ответ

2 голосов
/ 16 октября 2019

Вы можете изменить условие для возврата 0.0, я установил для теста x=="*"

df.iloc[:,3:] = df.iloc[:,3:].applymap(lambda x: 0.0 if x=="*" else x)

      f289                            f290        f291  ...  f308  f309  f310
0   01M015       P.S. 015 Roberto Clemente  Elementary  ...   0.0   0.0     0
1   01M019             P.S. 019 Asher Levy  Elementary  ...   0.0   0.0     0
2   01M020            P.S. 020 Anna Silver  Elementary  ...   0.0   0.0     0
3   01M034  P.S. 034 Franklin D. Roosevelt         K-8  ...   0.0   0.0    14
4   01M063       The STAR Academy - P.S.63  Elementary  ...   0.0   0.0     6
5   01M064           P.S. 064 Robert Simon  Elementary  ...   0.0   0.0     0
6   01M110   P.S. 110 Florence Nightingale  Elementary  ...   0.0   0.0     0
7   01M134        P.S. 134 Henrietta Szold  Elementary  ...   0.0   0.0     0
8   01M137      P.S. 137 John L. Bernstein  Elementary  ...   0.0   0.0     0
9   01M140          P.S. 140 Nathan Straus         K-8  ...   0.0   0.0     0
10  01M142          P.S. 142 Amalia Castro  Elementary  ...   0.0   0.0     0
11  01M184            P.S. 184m Shuang Wen         K-8  ...   0.0   0.0     0
12  01M188      P.S. 188 The Island School         K-8  ...   0.0   0.0    10

Обновление

определить функцию

def f(value) :
   if isinstance(value, str):
      if not(utils.representsInt(value) or utils.representsFloat(value) ) and re.search('[a-zA-Z]', x) is None:
      return 0.0
   return float(value)

Примените его к каждой ячейке

df = df.applymap(f)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...