Как удалить дубликаты в ссылках, созданных с использованием mechnize в Python? - PullRequest
0 голосов
/ 06 августа 2010

Вот мой код на python, который генерирует список объектов ссылок.Я хочу удалить дубликаты из них.

cb = list()
for link in br.links(url_regex="inquiry-results.jsp"):
        cb.append(link)
print set(cb)

Но он возвращает ошибку unhashable instance.link выглядит примерно так -

Link(
    base_url='http://casesearch.courts.state.md.us/inquiry/inquirySearch.jis',
    url='/inquiry/inquiry-results.jsp?action=..........',
    text='12',
    tag='a',
    attrs=[('href', '/inquiry/inquiry-results.jsp?action=.......'),
    ('title', 'Go to page 12')]
    ),

[Добавлены новые строки и точки только для удобства]

Как удалить дубликаты?

1 Ответ

3 голосов
/ 06 августа 2010

Вы можете создать словарь, используя URL в качестве ключей и получить его значения:

cb = {}
for link in br.links(url_regex="inquiry-results.jsp"):
    cb[link.url] = link
print cb.values()
...