Как получить полный URL из ресурса URL в Python - PullRequest
1 голос
/ 23 февраля 2012

На веб-страницах такие ресурсы, как изображения, CSS и Javascript загружаются веб-браузером клиента, если они встроены с тегами <img>, <link> и <script> соответственно.

URL ресурса может принимать различные формы, это может быть полный URL, например:

http://cdn.mysite.com/images/animage.jpg

Это может быть относительный путь:

images/animage.jpg
../images/animage.jpg

Или просто ссылка на корень

/images/animage.jpg

Как я могу создать функцию в Python, которая берет URL-адрес страницы и URL-адрес ресурса на ней и гарантирует, что полный URL-адрес возвращается?

Например:

def resource_url(page,resource):
    ## if the resource is a full URL, return that
    ## if not, use the page URL and the resource to return the full URL

1 Ответ

1 голос
/ 23 февраля 2012
from urlparse import urljoin

def resource_url(page, resource):
  if not resource.startswith(page):
    # doesn't start with http://example.com
    resource = urljoin(page, resource)
  return resource
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...