У меня большой массив данных.Я попытался привести его в порядок, повторяя строки и столбцы.Я узнал, что это занимает много времени.Поэтому я пытаюсь использовать pd.apply (), но у меня возникают проблемы с реализацией.
Вот попытка, которая занимает вечность:
def elim_com(x):
try:
x.replace(',',' ')
except ValueError:
return x
def to_number(x):
try:
x=float(x)
return(x)
except ValueError:
return x
for row in range(df.shape[0]):
for column in range(0,dfconvertendum.shape[1],1):
try:
dfconvertendum.iloc[row,column]=elim_com(dfconvertendum.iloc[row,column])
except TypeError:
continue
except AttributeError:
continue
for row in range(df.shape[0]):
for column in range(0,df.shape[1],1):
try:
dfconvertendum.iloc[row,column]=to_number(dfconvertendum.iloc[row,column])
except TypeError:
continue```
Here is my attempt using apply:
```## Clean using apply
def elim_com(x):
try:
x.replace(',',' ')
except ValueError:
return x
def to_number(x):
try:
x=float(x)
return(x)
except ValueError:
return x
dfconvertendum=dfconvertendum.apply(elim_com)
dfconvertendum=dfconvertendum.apply(to_num)
Цель состоит в том, чтобы иметь один dfс плавающей точкой, где в настоящее время существует df dtype с именем object.Я также попытался to_numeric, но это взрывает вещи разными способами.Я бы хотел легкую чистку.Я хочу оставить в такте все, что не является числом с запятыми, убрать запятые и преобразовать в число с плавающей точкой.Лучший! * * 1006