Использование HTMLParser для разбора таблицы в Python - PullRequest
2 голосов
/ 05 марта 2012

Я хочу разобрать таблицу HTML в 2d массив (строки и столбцы) в python, используя HTMLParser (только. Не хочу использовать BeautifulSoup и другие нестандартные библиотеки)

Это дляЛичный проект, делаю это для удовольствия: P

В любом случае, вот мой код.Это дает мне действительно запутанную ошибку - он говорит

1 Ответ

1 голос
/ 05 марта 2012

Я не проверил, что именно вы хотите сделать, но вы присваиваете строку self.txt, а затем пытаетесь использовать ее в качестве списка.

В конструкторе вы инициализируете self.txt пустым списком:

def __init__(self):
...
self.txt = []
...

и затем в методе handle_data:

def handle_data(self, text):
    if (len(self.txt) > 0 ) :
        self.txt.append(text + " ") # <-- Here you consider self.txt is a list

    if (self.in_table == 1 and self.in_th == 0):
        self.txt = text.lstrip() # <-- Here you **assign a string** to self.txt
...