Есть ли способ перебрать список с помощью регулярного выражения? - PullRequest
1 голос
/ 16 октября 2019

В основном я пытаюсь очистить все теги HTML из списка файлов HTML. Когда я пытаюсь сделать это, я получаю сообщение об ошибке:

TypeError: ожидаемая строка или байтовоподобный объект.

Так есть ли способ перебора посписок с регулярным выражением?

Вот код, который я использую:

import pymssql
import re

conn = pymssql.connect(
    host='xxx',
    port=xxx,
    user='xxx',
    password='xxx',
    database='xxxx'
)
cursor = conn.cursor() 
cursor.execute('SELECT 'column' FROM 'table'')

text = cursor.fetchall()

conn.close()

raw = []  
raw.append(text)

str(raw)

x = re.sub('<[^<]+?>', '', raw)

Ответы [ 2 ]

1 голос
/ 16 октября 2019

Ошибка:

TypeError: ожидаемая строка или байтовоподобный объект.

относится к тому факту, что raw указывает на list объект,чтобы указать на строку. Вам нужно сделать:

raw = str(raw)  # instead of just str(raw)

но, если text действительно строка, почему бы не просто:

x = re.sub('<[^<]+?>', '', text)

Для получения дополнительной информации см. Документацию по str , цитата ниже оттуда:

Возвращает str версию объекта. Подробности смотрите в str ().

0 голосов
/ 16 октября 2019

Проверьте пакет BeautifulSoup . Это HTML-парсер, который вы можете рассматривать как обычный словарь Python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...