Эквивалентные функции JavaScript для Python: urllib.quote () и urllib.unquote () - PullRequest
31 голосов
/ 03 июня 2009

Есть ли эквивалентные функции Javascript для Python urllib.quote() и urllib.unquote()?

Ближайшие, с которыми я столкнулся, это escape(), encodeURI() и encodeURIComponent() (и соответствующие им функции некодирования) , но, насколько я могу судить, они не кодируют / не декодируют тот же набор специальных символов.

Спасибо
Cameron

Ответы [ 5 ]

67 голосов
/ 08 июля 2011

Для записи:

JavaScript               |  Python
----------------------------------- 
encodeURI(str)           |  urllib.quote(str, safe='~@#$&()*!+=:;,.?/\'');
-----------------------------------
encodeURIComponent(str)  |  urllib.quote(str, safe='~()*!.\'')
6 голосов
/ 03 июня 2009

ОК, я думаю, что я собираюсь пойти с гибридным настраиваемым набором функций:

Кодирование: используйте encodeURIComponent (), затем вставьте косые черты обратно.
Декодировать: декодировать любые найденные значения% hex.

Вот более полный вариант того, что я в конечном итоге использовал (он также правильно обрабатывает Unicode):

function quoteUrl(url, safe) {
    if (typeof(safe) !== 'string') {
        safe = '/';    // Don't escape slashes by default
    }

    url = encodeURIComponent(url);

    // Unescape characters that were in the safe list
    toUnencode = [  ];
    for (var i = safe.length - 1; i >= 0; --i) {
        var encoded = encodeURIComponent(safe[i]);
        if (encoded !== safe.charAt(i)) {    // Ignore safe char if it wasn't escaped
            toUnencode.push(encoded);
        }
    }

    url = url.replace(new RegExp(toUnencode.join('|'), 'ig'), decodeURIComponent);

    return url;
}


var unquoteUrl = decodeURIComponent;    // Make alias to have symmetric function names

Обратите внимание, что если вам не нужны "безопасные" символы при кодировании ('/' по умолчанию в Python), то вы можете просто напрямую использовать встроенные функции encodeURIComponent() и decodeURIComponent().

Кроме того, если в строке есть символы Unicode (то есть символы с кодовой точкой> = 128), то для обеспечения совместимости с encodeURIComponent() JavaScript Python quote_url() должен быть:

def quote_url(url, safe):
    """URL-encodes a string (either str (i.e. ASCII) or unicode);
    uses de-facto UTF-8 encoding to handle Unicode codepoints in given string.
    """
    return urllib.quote(unicode(url).encode('utf-8'), safe)

И unquote_url() будет:

def unquote_url(url):
    """Decodes a URL that was encoded using quote_url.
    Returns a unicode instance.
    """
    return urllib.unquote(url).decode('utf-8')
3 голосов
/ 11 февраля 2016

Библиотека запросов немного популярнее, если вы не против дополнительной зависимости

from requests.utils import quote
quote(str)
1 голос
/ 01 июня 2010

Python: urllib.quote

Javascript: unescape

Я не проводил обширных испытаний, но для моих целей он работает большую часть времени. Я предполагаю, что у вас есть определенные персонажи, которые не работают. Может быть, если я использую какой-нибудь азиатский текст или что-то еще, оно сломается:)

Это произошло, когда я гуглил, поэтому я вставил это для всех остальных, если не специально для первоначального вопроса.

1 голос
/ 03 июня 2009

Попробуйте регулярное выражение. Примерно так:

mystring.replace(/[\xFF-\xFFFF]/g, "%" + "$&".charCodeAt(0));

Это заменит любой символ выше порядкового 255 с соответствующим представлением% HEX.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...