Функция R для таблицы сайта в датафрейме - PullRequest
0 голосов
/ 30 марта 2020

Я хочу загрузить таблицу из базы данных, которая содержит набор информации в формате таблицы

The website https://membranome.org/species/1

Я пробовал Rcurl, rlist, rvest и jsonlite, но не могу, например, сделать код jsonlite

a <- fromJSON("https://membranome.org/species/1")

Error: lexical error: invalid char in json text.
                                       <!DOCTYPE html> <html> <head>  
                     (right here) ------^

Мне нужна таблица с веб-сайта для анализа данных в формате фрейма данных, который я могу в дальнейшем записать и сохранить в формате CSV-файла

Например, мой ожидаемый результат

Family  protein Name  Protein ID  Localization Topology TM etc
aaaa       bbbb           123        2             152   58 ....
cccc       dddd            234       3              158   60 ....

Заранее спасибо

1 Ответ

0 голосов
/ 30 марта 2020

rvest может не работать в вашем случае, так как таблица отсутствует в источнике страницы. Альтернативным подходом может быть использование XMLHttpRequests (XHR) для извлечения данных json. Затем выполните синтаксический анализ json в объект R (фрейм данных или список), используя json пакет синтаксического анализатора, такой как jsonlite.

Выполните это Q / A , чтобы начать.

...