Как отобразить кодированный в utf-8 текст в визуализации пакета stmBrowser R? - PullRequest
0 голосов
/ 24 октября 2018

Я бы хотел использовать пакет stmBrowser R для визуализации результатов моделирования моей темы.Я использовал пакет R, называемый stm, для генерации объекта stm следующим образом:

out <- prepDocuments(processed$documents, processed$vocab, processed$meta)

stm_model <- stm(documents = out$documents, vocab = out$vocab,
                       K = 10, data = out$meta, max.em.its = 75, init.type = "Spectral" )

Пока все работает нормально.Но теперь я хочу визуализировать результаты stm следующим образом:

stmBrowser(stm_model, data=out$meta, c = ("isced_broad_field"), 
                text = "original_text", id = "index")

Мой out $ meta dataframe выглядит так:

enter image description here

Возникает следующая ошибка:

Error in rjson::toJSON(doc): unable to escape string. String is not utf8

Traceback:

1. stmBrowser(stm_model_curricula, data = out$meta, c = ("isced_broad_field"), 
 .     text = "original_text", id = "index")
2. paste(start, rjson::toJSON(doc), ",", sep = "")
3. rjson::toJSON(doc)

Но вектор original_text находится в UTF-8 .Если я использую другой вектор из $ meta dataframe, например, doc_id в тексте параметра, то все будет работать.

В чем причина этой ошибки?

...