Разделить текст с помощью strsplit - PullRequest
1 голос
/ 12 февраля 2020

Я пытаюсь разбить текстовый файл на список, используя R 's strsplit(). Разделителем является тег HTML <HR style="margin-bottom:0pt;">. Однако по какой-то причине я не могу правильно понять выражение, с помощью которого можно разделить текст.

text <- readr::read_file("https://www.sec.gov/Archives/edgar/data/904333/000119312518283722/d599396dnq.htm")
split <- strsplit(text, split = "\\<HR style\\=\"margin\\-bottom\\:0pt\\;\"\\>")
str(split)
#> List of 1
#>  $ : chr "<DOCUMENT>\n<TYPE>N-Q\n<SEQUENCE>1\n<FILENAME>d599396dnq.htm\n<DESCRIPTION>N-Q\n<TEXT>\n<HTML><HEAD>\n<TITLE>N-"| __truncated__

Создано в 2020-02-12 с помощью представ пакет (v0.3.0)

Есть идеи, что здесь нужно исправить?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...