Unicode имеет два режима композиции . Это объясняется в этом документе ICU . Очевидно, что строка, которую вы читали, использует режим декомпозиция (поэтому é
кодируется как e
и ´
). Windows по умолчанию использует режим precomposed , где é
кодируется как отдельный символ.
Преобразование из одного режима в другой имеет смысл, если вы хотите сравнить строки. Однако не существует единого способа сделать это. Документ ICU дает некоторую помощь.
Режим композиции должен, если все сделано правильно , не иметь никакого значения на экране.
Обновление
В этой статье MSDN объясняется немного больше о том, как нормализовать строки Unicode в Windows.