изменение определенных букв в турецком тексте с помощью R - PullRequest
0 голосов
/ 06 сентября 2018

Я анализирую турецкий текст. Мне нужно изменить несколько букв в тексте. Так как на турецком есть буквы ş ç ı ğ ü ö. Я хочу изменить их с помощью s c i g u o. Как я могу справиться с этим?

Я использовал следующие слова для одной буквы, но это не сработало, в тексте ничего не изменилось. gsub ("s", "ş", текст)

Любая помощь будет оценена.

1 Ответ

0 голосов
/ 06 сентября 2018

Мы можем использовать chartr. Пример * +1002 *

> string <- "ş ç ı ğ ü ö f s x q"
> chartr("ş ç ı ğ ü ö", "s c i g u o", string)
[1] "s c i g u o f s x q"

Другая альтернатива - stri_trans_general из пакета stringi

> library(stringi)
> stri_trans_general(string, "latin-ascii")
[1] "s c i g u o f s x q"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...