Я хочу преобразовать столбцы Actual, Forecast, Previous в число с плавающей запятой , чтобы я мог выполнять вычисления для них. CSV также содержит несколько NaN , которые должны оставаться на месте.
CSV-файл выглядит так:
2018-01-04 04:30:00,GBP,Low Impact Expected,Mortgage Approvals,65K,64K,65K
2018-01-04 04:51:00,EUR,Low Impact Expected,Spanish 10-y Bond Auction,1.53|1.8,,1.49|2.0
2018-01-04 05:01:00,EUR,Low Impact Expected,French 10-y Bond Auction,0.79|1.4,,0.36|1.9
2018-01-04 07:30:00,USD,Low Impact Expected,Challenger Job Cuts y/y,-3.6%,,30.1%
Пока я пробовал это:
df.columns = ['Date','Currency','Impact','Event','Actual','Forecast','Previous']
df = df[~(df['Actual'].isin('|','<']))]
#df = df[~df.Actual.str.contains("|")]
df['Actual'] = df['Actual'].str.replace('%', '')
df['Forecast'] = df['Forecast'].str.replace('%', '')
df['Previous'] = df['Previous'].str.replace('%', '')
df['Actual'] = df['Actual'].str.replace('K', '000')
df['Forecast'] = df['Forecast'].str.replace('K', '000')
df['Previous'] = df['Previous'].str.replace('K', '000')
for i in df['Actual']: float(i)
for i in df['Forecast']: float(i)
for i in df['Previous']: float(i)
Функции для избавления от | и <не работают </strong>. Похоже, многие предложения в Интернете не позволяют работать со значениями NaN в файле.
Также я не могу понять , как заменить% , в то же время переместить десятичную дробь , чтобы представление чисел было правильным.
Надеюсь, кто-нибудь может помочь. Спасибо!