SearchIO.parse xml blast и амперсанды cElementTree.ParseError: ошибка неправильной формы (неверный токен) - PullRequest
0 голосов
/ 05 июля 2018

Я хотел бы посоветовать обойти ошибку разбора XML. В моем выводе BLAST xml у меня есть описание с символом «&», которое исключает функцию SearchIO.parse.

Если я бегу

qresults=SearchIO.parse(PLAST_output,"blast-xml")

for record in qresults:
    #do some stuff

Я получаю следующую ошибку:

cElementTree.ParseError: not well-formed (invalid token): line 13701986, column 30

Который направляет меня к этой строке:

<Hit_def>Lysosomal & prostatic acid phosphatases [Xanthophyllomyces dendrorhous</Hit_def>

Есть ли способ переопределить это в biopython, чтобы мне не нужно было изменять мой xml-файл? Прямо сейчас я просто делаю цикл «попробуй / кроме», но это не оптимально!

Спасибо за вашу помощь! Courtney

...