Как читать твит, содержащий фигурный апостроф (') - PullRequest
0 голосов
/ 22 ноября 2018

Я читаю твиты в следующем формате:

545253503963516928|Wed Dec 17 16:25:40 +0000 2014|Massachusetts Pharmacy Owners Arrested in Meningitis Deaths http://xxxxxxxxx
545235402156937217|Wed Dec 17 15:13:44 +0000 2014|For First Time, Treatment Helps Patients With Worst Kind of Stroke, Study Says http://xxxxxxxxx 

Код, который я использую:

msn  <- read.table(file=".../msnhealthnews.txt", 
                   sep="|", 
                   header = FALSE, 
                   quote="", 
                   fill=TRUE, 
                   stringsAsFactors = FALSE,
                   numerals ="no.loss",
                   encoding = "UTF-8")

Есть твит с фигурным апострофом:

You’re Already Losing Your Mind:  http://on-msn.com/w0LiSx

Этот твит читается следующим образом:

"You\u0092re Already Losing Your Mind:  http://on-msn.com/w0LiSx"

Как я могу убедиться, что твит читается правильно?Я думал, что настройка encoding = "UTF-8" позаботится об этом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...