В конечном счете, операционная система в зависимости от того, какую кодовую точку (точки) они сохраняют при нажатии клавиши, хотя существует соглашение в форме нормализованных форм (в частности, NFC):
http://en.wikipedia.org/wiki/Unicode_equivalence#Normalization
Копирует и вставляет копии кодовых точек, а не концепций графем (графема - это менее неоднозначный термин, поскольку символ может означать как графему, так и кодовую точку).
Если вы конвертируетеиз некоторого другого набора символов в Unicode, тогда преобразование будет определять, какие кодовые точки вы в конечном итоге получите, и почти всегда совпадает с тем, как исходный набор символов кодирует составные символы - где исходный набор символов имеет одну кодовую точку для LATIN A WITHUMLAUT, тогда и Unicode тоже.