Я думаю, что использование слишком строгой регулярной эспрессии привело бы к потере большого количества обнаружений.
Вы должны проверить части 10 последовательных сеансов чата, содержащие более 5 цифр.
Таким образом, похоже, у вас будет подпрограмма анализа, которая будет вызываться после любой вставки сообщения из-за вычислительного веса,
После того, как 6 или более цифр будут выделены, замените их, как вам нравится, включая другие цифры для обозначений.В любом случае лучше сохранить исходные данные, поэтому вы можете попробовать и обучить свой алгоритм обнаружения, пока он не будет работать наилучшим образом.
Затем вы также можете изучить свои пользовательские данные для создания более сложной эвристики, такой как числа без учета регистранаписаны как буквы, смешанные, разделенные точками и т. д. *
Речь идет не о том, чтобы написать наиболее совершенное регулярное выражение, а о статистическом и динамическом подходе к решению проблемы.
И помните, что после того, как вы примете меры, пользователь изменит свои привычки вставки как следствие, поэтому статистика изменится, и вам нужно будет изучить и обновить свою эвристику.