Похоже, что в фильтре pattern_replace
используется регулярное выражение java.util.regex
.
Чтобы удалить любые символы, кроме любой буквы Unicode и десятичного числа di git, вы можете используйте
"specialCharactersFilter": {
"pattern": "[^\\p{L}\\p{Nd}]",
"type": "pattern_replace",
"replacement": ""
}
Чтобы убедиться, что вы сохраняете только цифры ASCII и удалите все хинди, тамильский и т. д. c. цифр, вы можете использовать такие варианты, как
"pattern": "[^\\p{L}0-9]"
См. демонстрацию регулярного выражения .