Мне нужно извлечь описание математической формулы и уравнения, написанное в исследовательских работах, из формата pdf в XML или в виде простого текста. Исследовательские документы имеют некоторые математические уравнения или формулы, сначала мне нужно извлечь математику, а затем текст, который их окружает, из файла PDF в текст. Плз, скажите, есть ли доступный инструмент или какой-либо код для реализации.