Я анализирую набор данных, в котором люди используют угловые скобки просто как знаки пунктуации, и никогда (никогда) не происходит фактическая разметка.
Есть ли способ изменить функциональность парсера таким образом, чтобы вместо вызова
"<snickers in background>"
одного токена, мы могли бы получить
"<", "snickers", etc?
Это выглядит как довольноПростая проблема, но я не смог найти простое исправление в документах или в просмотре кода.
Заранее спасибо!
PS Есть ли другие персонажи, которые ведут себя таким образом, о которых мне следует знать?