Я хотел бы посоветовать обойти ошибку разбора XML. В моем выводе BLAST xml у меня есть описание с символом «&», которое исключает функцию SearchIO.parse.
Если я бегу
qresults=SearchIO.parse(PLAST_output,"blast-xml")
for record in qresults:
#do some stuff
Я получаю следующую ошибку:
cElementTree.ParseError: not well-formed (invalid token): line 13701986, column 30
Который направляет меня к этой строке:
<Hit_def>Lysosomal & prostatic acid phosphatases [Xanthophyllomyces dendrorhous</Hit_def>
Есть ли способ переопределить это в biopython, чтобы мне не нужно было изменять мой xml-файл? Прямо сейчас я просто делаю цикл «попробуй / кроме», но это не оптимально!
Спасибо за вашу помощь!
Courtney