Одно из решений, конечно, состоит в том, чтобы просто найти их всех, просто использовать их как обычно, хотя я предполагаю, что их может быть довольно много.
Если вы используете UTF8, то вы обнаружите, что такие символы часто делятся на две части, сам «базовый» символ, за которым следует акцент (я думаю, 0x0300 и 0x0301), также называемый символом комбинирования. Однако это не всегда может быть правдой, поскольку некоторые символы также могут быть записаны с использованием «жестко закодированного» кода символа ... поэтому сначала вам нужно нормализовать строку UTF8 в форме NFD.
Конечно, вы можете также превратить любую имеющуюся строку в UTF8, а затем обратно в исходную кодировку ... но издержки могут стать довольно большими, если вы выполняете массовые операции.
РЕДАКТИРОВАТЬ: Чтобы конкретно ответить на ваш вопрос, лучшее решение, скорее всего, нормализует ваши строки в форме NPT UTF8, а затем просто добавляет 0x0300 и 0x0301 в список допустимых символов и любые другие комбинируемые символы, которые вы хотите разрешить (например, в качестве точек в строке вы можете найти их все в "charmap" в Windows, посмотрите на 0x0300 и "вверх").