Замена смайликов в тексте - PullRequest
       8

Замена смайликов в тексте

0 голосов
/ 28 августа 2018

Я пытаюсь заменить смайлики их значением.

Tweets$text[19]
"I ❤️ flying  . ☺️\U0001f44d"

Для этой задачи я использую пакет textclean. Лексикон включает в себя не только описание эмодзи, но и представление байт-кода (x: столбец):

hash_emojis[1:3]
              x                        y
1: <e2><86><95>            up-down arrow
2: <e2><86><99>          down-left arrow
3: <e2><86><a9> right arrow curving left

Итак, результат выглядит так:

Tweets$text[19] = replace_emoji(Tweets$text[19], emoji_dt = lexicon::hash_emojis)

Tweets$text[19]

 "I red heart <ef><b8><8f> flying . smiling face <ef><b8><8f> thumbs up "

Я хочу получить описание только без представления байтового кода, потому что мне нужно очистить его снова. Как я могу применить только «у столбца» к тексту? Возможно, их лучший способ справиться с эмодзи в R?

1 Ответ

0 голосов
/ 28 августа 2018

После использования replace_emoji вы можете использовать replace_non_ascii, чтобы избавиться от кодов ASCII

text <- "I ❤️ flying  . ☺️\U0001f44d"
t <- replace_emoji(text)
replace_non_ascii(t)
"I red heart flying . smiling face thumbs up"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...