Как сохранить исходный формат значений после unlist (lapply (mydata, function (x) {x $ getElementText ()})) - PullRequest
0 голосов
/ 13 февраля 2020

Я пытаюсь сохранить формат исходных значений. Формат данных:

 <option value="xxxxx                  ">xxxx                   </option>
      <option value="yyyy                 ">yyyy                  </option>
      <option value="zzzzzzz              ">zzzzzzz                 </option>
...

Но я получаю это после использования

unlist(lapply(mydata, function(x) {x$getElementText()}))

head(mydata)
[1] "xxxxx" "yyyy"  "zzzzzzz"

Что мне нужно:

 head(mydata)
    [1] "xxxxx                  " "yyyy                 "  "zzzzzzz              "

Я ценю любую помощь

1 Ответ

0 голосов
/ 13 февраля 2020

Метод getElementText нормализует текст так, как он выглядит в браузере. Если на странице HTML есть несколько стандартных пробелов между словами, почти все браузеры будут отображать это как один пробел. Тем не менее, вы можете получить базовое значение из

 x$getAttribute('textContent')

, которое было найдено здесь

Или в вашем случае, если вам нужен атрибут значения из тега опции

 x$getElementAttribute('value')
...