Я не знаю C #, но это больше вопрос UNICODE. Я бы сделал это с помощью нормализации UNICODE , используя эту функцию .
Сначала нормализуем до разложенной формы. Далее отфильтровываем всех персонажей из категории «Марка без пробелов» [Mn] . Наконец, вернитесь к составленной форме.
Если я правильно вижу, ваш глиф представлен в ЮНИКОДЕ как ARABIC LETTER ALEF WITH HAMZA ABOVE
( U + 0623 , [Lo] ), за которым следует ARABIC FATHATAN
( U + 064B , [Mn] ). Первый символ разлагается до ARABIC LETTER ALEF
( U + 0627 , [Lo] ) + ARABIC HAMZA ABOVE
( U + 0654 , [Mn] ).
Вот цепочка преобразований (первая стрелка указывает на декомпозицию, вторая - отфильтровывает непространственные метки, третья - композицию):
U+0623 + U+064B → U+0627 + U+0654 + U+064B → U+0627 → U+0627
После разложения удалите всех персонажей из категории [Mn] и вернитесь назад, у вас останется только ARABIC LETTER ALEF
.