Я пытаюсь разбить текстовый файл на список, используя R
's strsplit()
. Разделителем является тег HTML <HR style="margin-bottom:0pt;">
. Однако по какой-то причине я не могу правильно понять выражение, с помощью которого можно разделить текст.
text <- readr::read_file("https://www.sec.gov/Archives/edgar/data/904333/000119312518283722/d599396dnq.htm")
split <- strsplit(text, split = "\\<HR style\\=\"margin\\-bottom\\:0pt\\;\"\\>")
str(split)
#> List of 1
#> $ : chr "<DOCUMENT>\n<TYPE>N-Q\n<SEQUENCE>1\n<FILENAME>d599396dnq.htm\n<DESCRIPTION>N-Q\n<TEXT>\n<HTML><HEAD>\n<TITLE>N-"| __truncated__
Создано в 2020-02-12 с помощью представ пакет (v0.3.0)
Есть идеи, что здесь нужно исправить?