Итак, я работаю над проблемой анализа текста и пытаюсь удалить все числа от 0 до 999 с регулярным выражением в Python.Я пробовал Regex Numeric Range Generator, чтобы получить регулярное выражение, но у меня ничего не получилось.Я могу только удалить все цифры.
Я пробовал несколько регулярных выражений, но это не сработало.вот что я пробовал
# Remove numbers starting from 0 ==> 999
data_to_clean = re.sub('[^[0-9]{1,3}$]', ' ', data_to_clean)
Я пробовал это также:
# Remove numbers starting from 0 ==> 999
data_to_clean = re.sub('\b([0-9]|[1-8][0-9]|9[0-9]|[1-8][0-9]{2}|9[0-8][0-9]|99[0-9])\b', ' ', data_to_clean)
это:
^([0-9]|[1-8][0-9]|9[0-9]|[1-8][0-9]{2}|9[0-8][0-9]|99[0-9])$
и это:
def clean_data(data_to_clean):
# Remove numbers starting from 0 ==> 999
data_to_clean = re.sub('[^[0-9]{1,3}$]', ' ', data_to_clean)
return data_to_clean
У меня много цифр, но мне нужно удалить только те, которые меньше 3 десятичных знаков, и оставить остальные.
Спасибо за вашу помощь