Я читаю твиты в следующем формате:
545253503963516928|Wed Dec 17 16:25:40 +0000 2014|Massachusetts Pharmacy Owners Arrested in Meningitis Deaths http://xxxxxxxxx
545235402156937217|Wed Dec 17 15:13:44 +0000 2014|For First Time, Treatment Helps Patients With Worst Kind of Stroke, Study Says http://xxxxxxxxx
Код, который я использую:
msn <- read.table(file=".../msnhealthnews.txt",
sep="|",
header = FALSE,
quote="",
fill=TRUE,
stringsAsFactors = FALSE,
numerals ="no.loss",
encoding = "UTF-8")
Есть твит с фигурным апострофом:
You’re Already Losing Your Mind: http://on-msn.com/w0LiSx
Этот твит читается следующим образом:
"You\u0092re Already Losing Your Mind: http://on-msn.com/w0LiSx"
Как я могу убедиться, что твит читается правильно?Я думал, что настройка encoding = "UTF-8"
позаботится об этом.