Это хинди. «О, выглядящий символ» - это заполнитель, используемый, когда диакритический знак хинди отображается без буквы, на которой он стоит. Они могут просто отображать диакритический знак над пустым пространством, например ´, но по какой-то причине они предпочитают кружок для обозначения символа, который должен быть там.
Проблема связана с тем, как диакритические знаки пишутся для хинди. Чтобы было легче понять, я буду использовать европейское акцентированное письмо для моего примера, букву é. Есть две возможности:
1. Это может быть один персонаж. Если вы нажмете клавишу Backspace, весь персонаж исчезнет.
2. é может состоять из двух символов, e и ´, где ´ содержит информацию о размещении, поэтому результат будет выглядеть как é, а не e´. Если вы нажмете клавишу Backspace, исчезнет только диакритический знак, и вам придется снова нажать клавишу Backspace, чтобы удалить символ e.
Для европейских языков вы вообще не видите 2). Для тайского языка используются как 1), так и 2) (что создает проблему для поиска, поскольку односимвольный символ é не соответствует двухсимвольному символу é). Для хинди существует слишком много диакритических знаков и возможных комбинаций, поэтому существует только 2).
Итак, поскольку у вас есть два символа, а не один, единственное решение - написать собственный код переноса строки. Это также даст вам возможность предотвратить разрывы строк, происходящие в середине работы
д, что никогда не бывает приятно.