Есть ли способ токенизировать предложения и повторять «div» и «withTags» в тексте? - PullRequest
0 голосов
/ 04 августа 2020

Я хочу повторить "div" и "withTags" в текстовом файле после токенизации файла. Мне удалось выполнить итерацию с помощью div и withTags для получения нетокенизированного текста. Однако я получаю сообщение об ошибке, когда повторяю div и withTags после его токенизации. Есть ли выход из этого?

text <- «Непонятно, о какой победе во Флориде имели в виду Макинани и Трамп, но в прошлом месяце Верховный суд отклонил экстренную петицию за попытки демократов во Флориде отменить закон, запрещающий бывшим преступникам голосовать, если они не уплатили все свои штрафы или реституцию. Это не обязательно связано с голосованием по почте. Тем временем команда президента борется за сохранение аспектов голосования по почте, которые, как они надеются, предложат Трампу стратеги c преимущество. "</p>

library(htmltools)
library(tokenizers)
library(quanteda)

b <- tokenize_sentences(text)

trial <- b

buslist <- lapply(
  seq_along(trial),
  function(x, k){
    bus <- withTags(div(id = k,x[k]))
    return(bus)},
  x = trial)

names(buslist) <- q

получение этой ошибки:

`Error in writeImpl(text) : 
  Text to be written must be a length-one character vector
> `
...