Я пытаюсь заменить смайлики их значением.
Tweets$text[19]
"I ❤️ flying . ☺️\U0001f44d"
Для этой задачи я использую пакет textclean
. Лексикон включает в себя не только описание эмодзи, но и представление байт-кода (x: столбец):
hash_emojis[1:3]
x y
1: <e2><86><95> up-down arrow
2: <e2><86><99> down-left arrow
3: <e2><86><a9> right arrow curving left
Итак, результат выглядит так:
Tweets$text[19] = replace_emoji(Tweets$text[19], emoji_dt = lexicon::hash_emojis)
Tweets$text[19]
"I red heart <ef><b8><8f> flying . smiling face <ef><b8><8f> thumbs up "
Я хочу получить описание только без представления байтового кода, потому что мне нужно очистить его снова. Как я могу применить только «у столбца» к тексту? Возможно, их лучший способ справиться с эмодзи в R?