Не делайте этого с SQLite.
Делайте это с вашим языком программирования, вашей платформой, использующей SQLite.
В таблице, где у вас есть столбец с HTML-кодом.Добавьте дополнительные столбцы для данных о html.Вам придется собирать данные для дополнительных столбцов, в то время как вы анализируете html с помощью вашей инфраструктуры.
Отслеживает данные о структуре, имеющейся в формате html, и сохраняет в дополнительном столбце текстовое содержимое данных html..
Вы можете получить все теги простым REGEX:
/<?[^<>]+>?/
Проверьте, как вы получаете данные путем сканирования html-данных на наличие тегов с помощью приведенного выше регулярного выражения и напишите повторную оценку для содержимого тегов.(т.е. если строка в массиве результатов начинается с «<», это тэг, отсканировав ее с помощью <code>/<\s*\/\s*[^>]+>/, вы увидите, является ли она конечным тэгом, и отсканировав ее с помощью /<\s*[^\/>]+\s*\/\s*>/
, увидите, будет ли онаявляется одним закрытым тегом. Если ни одно из дифференцированных состояний не применимо, это текстовое содержимое.