Как включить диарез / трему в URL для запроса веб-сайта The List List? - PullRequest
0 голосов
/ 07 октября 2019

Я запрашиваю веб-сайт Списка растений (http://www.theplantlist.org) от R, но это не работает, если в названии растения присутствует диарез (С). Обычно, поиск названия вида растения, например, "Vaccinium acosta"", правильно ведет на страницу отдельных видов (в R и в Firefox) с URL-адресом" http://www.theplantlist.org/tpl1.1/search?q=vaccinium+acosta".

Как я могу запросить страницу вида для "Vaccinium borneënse", используя название вида в URL (не- неизвестный - идентификатор записи, как в http://www.theplantlist.org/tpl1.1/record/tro-50262461)? Возможно ли это даже для этого веб-сайта?

Я пробовал, среди прочего, следующее, но все они ведут на страницу обзора для рода. Vaccinium (содержит много разных видов):

http://www.theplantlist.org/tpl1.1/search?q=vaccinium+borneënse
http://www.theplantlist.org/tpl1.1/search?q=Vaccinium+borneense
http://www.theplantlist.org/tpl1.1/search?q=Vaccinium+borne%C3%ABnse
http://www.theplantlist.org/tpl1.1/search?q=Vaccinium+borneënse

В конечном счете, я хочу прочитать страницы конкретных видов со списком видов в R, используя read.csv:

read.csv("http://www.theplantlist.org/tpl1.1/search?q=vaccinium+acosta&csv=true")

1 Ответ

0 голосов
/ 07 октября 2019

Вы можете использовать: http://www.theplantlist.org/tpl1.1/search?q=Vaccinium+borne?nse, как в тексте http://www.theplantlist.org/tpl1.1/search. Вы должны просто перекодировать его для каждого вокала с диарезом.

ИМХО, это ошибка списка растений. Диарез не является действительными символами (для ботанической номенклатуры), но используется только для облегчения произношения, поэтому база данных должна допускать второй запрос.

...