У меня есть следующая строка HTML:
s = "I have : <i><λv<sub>1</sub>,w> + <v<sub>2</sub>,w></i>"
Теперь я хотел бы преобразовать его в LaTex. Для этого я использую pypandoc .
import pypandoc
text = pypandoc.convert_text(s,'latex', format = "html", extra_args = ['--wrap=preserve'] )
text
Я получаю:
I have : \emph{1,w\textgreater{} + 2,w\textgreater{}}\r\n
который в читаемом LaTex становится:

Кто-нибудь знает, как это исправить?
Достаточно забавно, если я просто наберу вышеупомянутую строку в Stackoverflow, я получу правильный вывод:
У меня есть: <λv <sub>1 , ш> + 2, ш>
Меня интересует общее решение, а не ручное исправление для этого конкретного примера, поскольку у меня есть огромное количество HTML-текста, который мне нужно расшифровать.
Как мне добиться этого для LaTex?