import pandas as pd
df = pd.DataFrame({'RMDS': ['10.686000','NYSE_XNAS','0.472590','qrtr'], 'Mstar': ['10.690000', 'NYSE_XNAS', '0.473590','mnthly']})
Dataframe df будет выглядеть так:
Mstar RMDS
0 10.690000 10.686000
1 NYSE_XNAS NYSE_XNAS
2 0.473590 0.472590
3 mnthly qrtr
Я хочу сравнить значение «RMDS» с «Mstar», а тип данных - «объект», это огромный массив данных, и мне нужно сравнить округленные значения
mask = np.around (pd.to_numeric (df.Mstar), 2)! = Np.around (pd.to_numeric (df.RMDS), 2)
df_Difference = df [маска]
, так как значения в столбцах не согласованы, поэтому всякий раз, когда строковые значения приходят как 'qrtr', вышеуказанная логика не работает, так как я использую pd.to_numeric, но все же я хотел сравнить 'qrtr' из 'RMDS' в 'mnthly' в «Мстар»
Есть ли способ, которым я мог бы справиться с такой ситуацией.