Используя приведенный ниже код, я могу использовать re , чтобы изменить строку вроде этой: *12.2
на число с плавающей точкой, например: 12.2
:
import re
numeric_const_pattern = '[-+]? (?: (?: \d* \. \d+ ) | (?: \d+ \.? ) )(?: [Ee] [+-]? \d+ ) ?'
rx = re.compile(numeric_const_pattern, re.VERBOSE)
print('converted string to float number is', float(rx.findall("*12.2")[0]))
converted string to float number is 12.2
Но у меня есть панда df, которая:
df = pd.DataFrame([[10, '*41', '-0.01', '2'],['*10.5', 54, 34.2, '*-0.076'],
[65, -32.01, '*344.32', 0.01], ['*32', '*0', 5, 43]])
0 1 2 3
0 10 *41 -0.01 2
1 *10.5 54 34.2 *-0.076
2 65 -32.01 *344.32 0.01
3 *32 *0 5 43
Как я могу применить вышеописанную функцию к этому df, чтобы удалить все символы звездочки, а также сделать полные pand dtype типа float, как показано ниже?
0 1 2 3
0 10 41 -0.01 2
1 10.5 54 34.2 -0.076
2 65 -32.01 344.32 0.01
3 32 0 5 43