Я работаю с pandas фреймом данных, в котором столбец содержит нестандартные значения. Есть ли способ, которым я могу извлечь или заменить символы и цифры в столбце. Я очень новичок в применении шаблонов регулярных выражений для очистки данных.
один столбец - Precise_Age, а второй столбец - браузер.
В браузере столбец я хочу только имя и версию. (Если версия 10.1. 2 тогда я хочу только 10) - Android 10, Android 4, iOS 11 и т. Д. c.
Браузер
Browser desired_output
75.0.3770.143 | Chrome Dev | Android | 9 Android 9
78.0.3904.108 | Chrome Dev | Android | 9 Android 9
79.0.3945.93 | Chrome Dev | Android | 9 Android 9
79.0.3945.93 | Chrome Dev | Android | 8.0.0 Android 8
| | Android | 8.1.0 Android 8
79.0.3945.116 | Chrome Dev | Android | 10 Android 10
79.0.3945.93 | Chrome Dev | Android | 5.1 Android 5
| | Android | 10 Android 10
| Facebook | Android | 8.1.0 Android 8
79.0.3945.116 | Chrome Dev | Android | 4.4.4 Android 4
| | Android | 8.1.0 Android 8
79.0.3945.79 | Chrome Dev | Windows | 8 Windows 8
77.0.3865.116 | Chrome Dev | Android | 9 Android 9
88.1.284108841| Google Search | iOS | 13.3 iOS 13
В Возраст col, я хочу только стандартные значения, заменяет пробелы, запятые и т. Д. c. если возраст имеет более 100 значений, тогда все значения пропускаются.
Возраст
Age desired_output
67 67
66 66
67.5 67
60대후반 60
1949ë…„ null
63세 63
83ë…„ìƒ 83
11세 11
7217861839 null
59 years 59
60세 60
73.87083774 73
54ë…„ìƒ 54
55세 55
327 null
37ë…„ìƒ 37
642 null
523 null
0.61 0
53세 53
42ë…„ìƒ 42
757575 null
91.98192554 91
1.11991 1
83세(만82세) 83
4324234 null
8827 null
11 Years 11