Я работаю над проектом по очистке веб-страниц, и у меня есть словарь, содержащий ссылки на все сайты, на которых я проведу еще одну итерацию очистки. Эти ссылки не содержат общую ссылку URL-адреса (https://www.cambridge.org/core/journals/international-organization/issue/A347B8A4BBCDAE6D7DA2094803DD7857 является примером. Все, что находится после .org, находится в словаре.)
Однако я получаю сообщение об ошибке с кодом ниже at link = urljoin (root_url, link), который говорит: «TypeError: объект 'module' не вызывается». Я использую неправильный подход с этим?
root_url = 'https://www.cambridge.org'
issue_link_dict = (issues['decade2010']['panel70'], ['panel71'], ['panel72'], ['panel73'][0:])
for link in issue_link_dict:
link = urljoin(root_url, link)
print(link)
Редактирование, чтобы добавить, что я пытаюсь получить доступ к своим ссылкам из словаря в словаре, созданном с помощью этого кода. Я надеялся, что панели позволят мне выбрать, для каких лет в течение десятилетия мне нужны ссылки:
for l in issue_links:
if l.startswith('#decade'):
decade = l[1:]
issues[decade] = {}
elif l.startswith('#panel'):
panel = l[1:]
issues[decade][panel] = []
else:
issues[decade][panel].append(l)
`