Удалить теги HTML из строки (программирование R) - PullRequest
4 голосов
/ 22 сентября 2010

Есть ли простой способ удалить HTML-теги из символьной строки в R?

В настоящее время я извлекаю данные опроса из XML-документа, и для заголовка вопроса используется HTML из дизайна опроса.в этом, как это.

"Why did you give this performance question a low score?<br />"

Любой способ легко удалить <br />?

Любая помощь будет оценена.

1 Ответ

4 голосов
/ 22 сентября 2010

Взгляните на ?gsub и ?regex. Вот простой код для удаления <br />, но он не будет работать для всех потенциальных HTML-тегов.

> string <- "Why did you give this performance question a low score?<br />"
> gsub("<.*/>","",string)
[1] "Why did you give this performance question a low score?"
...