Проблемы с кодированием чтения .bib в R с помощью RefManageR - PullRequest
0 голосов
/ 19 ноября 2018

Я пытаюсь подписаться на эту запись в блоге , чтобы автоматически создавать .md файлы для каждой из моих публикаций для использования в blogdown. Функция в посте использует пакет RefManageR для чтения записей из файла BibTeX и создает файл .md для каждой записи.

Моя проблема в том, что я не могу заставить RefManageR правильно читать специальные символы, даже когда я стараюсь сохранить .bib с кодировкой UTF-8 и указать кодировку в вызове ReadBib.

В качестве примера: я генерирую .bib, используя Zotero, экспортируя коллекцию в BibTeX с кодировкой UTF-8. Это дает мне следующую запись в моем .bib:

@article{senior_pantropical_2017,
         title = {A pantropical analysis of the impacts of forest 
                 degradation and conversion on local temperature},
         volume = {7},
         issn = {2045-7758},
         doi = {10.1002/ece3.3262},
         number = {19},
         journal = {Ecology and Evolution},
         author = {Senior, Rebecca A. and Hill, Jane K. and González del 
                   Pliego, Pamela and Goode, Laurel K. and Edwards, David P.},
         month = oct,
         year = {2017},
         pages = {7897--7908}
}

Как видите, на одном из имен авторов (González del Pliego) есть ударение. Я проверяю кодировку, открывая в RStudio (где символы отображаются правильно) и чтобы быть вдвойне уверенным, я делаю «Сохранить с кодировкой». Независимо от того, что я делаю, когда я читаю .bib в R примерно так:

ReadBib('path/to/refs.bib', .Encoding = "UTF-8")

Это всегда выглядит так:

[1] R. A. Senior, J. K. Hill, P. González del Pliego, et al. “A pantropical analysis of the impacts of forest degradation and conversion on local temperature”. In: _Ecology and Evolution_7.19 (Oct. 2017), pp. 7897-7908. ISSN: 2045-7758. DOI: 10.1002/ece3.3262.

Почему А появляется как А? Я пробовал различные пакеты и функции (RefManageR::ReadBib, bibtex::read.bib и bib2df::bib2df) и различные способы задания и проверки кодировки. Я не могу набирать символы вручную (например, {\'a}), потому что некоторые из моих публикаций имеют много авторов. Не уверен, как поступить.

...