Я работаю над корпусом, содержащим транслитерированные слова и слова на реальном языке, в большинстве случаев они используют одни и те же символы и алфавит. Как мне их разделить?