Я пытаюсь перебрать указанный столбец c в моем фрейме данных.
Столбец:
df['column'] = ['1.4million', '1,235,000','100million',NaN, '14million', '2.5mill']
Я пытаюсь очистить этот столбец и в конечном итоге получить все целые числа для дальнейшей работы. Я застрял на шаге, чтобы вычистить «миллион». Я хотел бы заменить «миллион» пятью нулями, когда есть десятичная дробь (ie 1.4million становится 1.400000), и «миллион» шестью нулями, когда нет десятичной дроби (ie 100million становится 100000000).
Для упрощения, первый шаг, который я пытаюсь сделать, это просто сосредоточиться на фильтрации значений с десятичным числом и заменить их на 5 нулей. Я пытался использовать np.where для этого, однако я не могу использовать метод замены с numpy.
Я также пытался использовать pd.DataFrame.where, но получаю сообщение об ошибке:
for i,row in df.iterrows():
df.at[i,'column'] = pd.DataFrame.where('.' in df.at[i,'column'],df.at[i,'column'].replace('million',''),df.at[i,'column'])
``AttributeError: 'numpy.ndarray' object has no attribute 'replace'
Я уверен, что здесь что-то отсутствует. (Я также уверен, что мне скажут, что мне не нужно использовать здесь иероглифы, поэтому я открыт для предложений по этому вопросу).