Является ли ваш атрибут (частью) ключа или нет, не имеет никакого отношения к проблеме.
У вас есть проблемы с преобразованием набора символов с ЛЮБЫМ трафиком данных в / из этого атрибута в любом случае, независимо от того, является ли ключом или нет.
Да, для того, чтобы кодировать «правильно» и иметь наилучшую возможную гарантию того, что ваши данные никогда не будут повреждены из-за проблем преобразования набора символов, вам необходим набор символов Unicode и одна из его кодировок.
Между прочим, у меня есть некоторые серьезные сомнения относительно самой таблицы. Что вы делаете с Гейдельбергом, Германия, и Гейдельбергом, Южная Африка? Оксфорд, Великобритания, и Оксфорд, США, где вообще нет штата без такового?
Какая информация зависит от этого ключа? Если их вообще нет, то ваша таблица больше относится к «типу переменной», чем к «подлинной таблице». В этом случае вы можете просто забыть таблицу и сделать ваши атрибуты названия города просто строкой.
Если вам действительно необходимо создавать некоторые "канонические варианты написания" для названий городов при экспорте данных из базы данных, то я бы посоветовал попытаться создать "таблицу фонетического поиска", в которой "часто используемые варианты написания" связаны с «каноническое правописание», которое вы должны произвести. Однако следует ожидать серьезных усилий по заполнению таких таблиц.
В этом случае, в дополнение к уже упомянутым вопросам, касающимся мюнхенского / мюнхенского и западно-греческого алфавита, не забывайте о проблемах типа Льеж / Луйк / Люттих (Мюнхен / Мюнхен).