Проблема с соединением url root с окончанием url, когда url оканчивается на словарь - PullRequest
0 голосов
/ 13 июля 2020

Я работаю над проектом по очистке веб-страниц, и у меня есть словарь, содержащий ссылки на все сайты, на которых я проведу еще одну итерацию очистки. Эти ссылки не содержат общую ссылку URL-адреса (https://www.cambridge.org/core/journals/international-organization/issue/A347B8A4BBCDAE6D7DA2094803DD7857 является примером. Все, что находится после .org, находится в словаре.)

Однако я получаю сообщение об ошибке с кодом ниже at link = urljoin (root_url, link), который говорит: «TypeError: объект 'module' не вызывается». Я использую неправильный подход с этим?

root_url = 'https://www.cambridge.org'
issue_link_dict = (issues['decade2010']['panel70'], ['panel71'], ['panel72'], ['panel73'][0:])
for link in issue_link_dict:
    link = urljoin(root_url, link)
    print(link)

Редактирование, чтобы добавить, что я пытаюсь получить доступ к своим ссылкам из словаря в словаре, созданном с помощью этого кода. Я надеялся, что панели позволят мне выбрать, для каких лет в течение десятилетия мне нужны ссылки:

for l in issue_links:
        if l.startswith('#decade'):
            decade = l[1:]
            issues[decade] = {}
        elif l.startswith('#panel'):
            panel = l[1:]
            issues[decade][panel] = []
        else:
            issues[decade][panel].append(l)

`

...