Согласно документации Django , urlize
преобразует URL-адреса в тексте в интерактивные ссылки. Согласно RFC1728 , URL-адреса могут содержать только «графические печатные символы набора кодированных символов US-ASCII.»
Упомянутые вами символы не являются частью необходимого подмножества ASCII, поэтому можно ожидать, что urlize
завершится неудачно. Вам нужно будет избежать ввода, чтобы удалить такие символы. UTF-8 действителен для содержимого документа HTML, но не для URL.
Ваш контент в формате UTF-8 можно преобразовать в ASCII, используя фрагмент, найденный здесь: http://djangosnippets.org/snippets/588/