Используется та же кодировка , но с разными нормировками.
>>> import unicodedata
>>> "Brüno".encode("utf-8")
b'Bru\xcc\x88no'
>>> unicodedata.normalize("NFC", "Brüno").encode("utf-8")
b'Br\xc3\xbcno'
Некоторые графемы (вещи, которые вы видите как один «символ»), особенно те, которые содержат диакритические знаки, могут быть сделаны из разных символов. «Ü» может быть либо «u» с комбинированным диарезом, либо самим символом «ü» (комбинированная форма). Комбинированные формы не существуют для каждой комбинации букв и диакритических знаков, но они существуют для часто используемых (= существующих на общих языках).
Нормализация Unicode преобразует все символы, которые образуют графемы, в комбинированные или отдельные символы. Метод нормализации "NFC", или Форма нормализации канонической композиции , максимально комбинирует символы.
Для сравнения, другая основная форма, Форма нормализации канонического разложения , или "NFD", создаст вашу версию:
>>> unicodedata.normalize("NFD", "Brüno").encode("utf-8")
b'Bru\xcc\x88no'