Я уверен, что можно работать непосредственно с дампом данных XML, о котором упоминает @RichieHindle, но я был намного счастлив с версией @ nobody_'s sqlite - особенно после добавления индексов в качестве файла README в этом Версия sqlite говорит.
Если у вас есть полная индексированная версия sqlite и вы хотите загрузить подмножество с тегами Python в базу данных MySQL, это можно рассматривать как простое, но аккуратное упражнение с использованием двух экземпляров API БД: чтение из sqlite и запись на MySQL (лично я нашел производительность sqlite полностью удовлетворительной после создания индекса, поэтому я не извлекал подмножество и не переходил на другие механизмы БД) - ни супа , ни мыла не требовалось для цель. В любом случае, для меня это было намного проще и быстрее, чем загрузка из XML напрямую, несмотря на lxml и все.
Конечно, если вы все еще хотите выполнить загрузку подмножества, и если у вас возникнут какие-либо проблемы при его кодировании, спросите (с примерами схемы и кода, сообщениями об ошибках, если они есть, и т. Д.), И SOers попытаются ответить как обычно! -)