Кто-нибудь знает, как загрузить этот конкретный файл. xml в качестве кадра данных в Python или R?
Набор данных из USPTO (любой сделает) https://bulkdata.uspto.gov/data/patent/application/redbook/fulltext/2019/
Я могу загрузить этот файл в виде строки в терминал, но будет гораздо лучше, если я смогу просто загрузить или сохранить их в формате данных или в формате JSON.
Некоторые ошибки, с которыми я сталкиваюсь в R
Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) :
XML declaration allowed only at the start of the document [64]
Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) :
Extra content at the end of the document [5]
XML declaration allowed only at the start of the document
Extra content at the end of the document
Error: 1: XML declaration allowed only at the start of the document
2: Extra content at the end of the document