Я пишу парсер HTML, который генерирует файл XLSX из таблицы HTML. Таблица содержит цветные данные, такие как:
<td>Some <mark color="red"><b>coloured, bolded</b></mark> text</td>
Во время синтаксического анализа я генерирую массив токенов, готовых для передачи в write_rich_string
или write_string
, в зависимости от того, сколько строк генерируется синтаксическим анализатором HTML .
Есть довольно много случаев, когда парсер HTML генерирует массив из 2 строк и формат для записи в ячейку, например:
['string 1', 'string2', format]
Я не могу использовать write_string
потому что существует более 1 строки. Но я также не могу использовать write_rich_string
, потому что write_rich_string
выводит формат и блокирует массив из 2 строк. Передача следующих данных в write_rich_string
не вызывает никаких проблем, что выглядит странно в сравнении:
['string1', 'string2', 'string3', format]
Я что-то упустил?