Символы Python URL - PullRequest
       8

Символы Python URL

2 голосов
/ 18 февраля 2010

Я действительно новичок в Python и программировании в целом, но я добился определенных успехов.

Я могу извлекать некоторые данные из Интернета через API, и результатом должна быть строка. Однако я вижу некоторые примеры, такие как "& amp;" и "& quot" (я изменил наборы символов, чтобы он правильно выводился на экран)

Я полагаю, что есть способ очистить эту строку и удалить символы так, чтобы она выглядела так, как на экране компьютера. Я пытался найти urldecoding, но по общему признанию, я даже не знаю, является ли это решением.

Будем весьма благодарны за помощь в удалении этих «лишних» символов и создании читаемой строки!

Заранее большое спасибо,

Брок

1 Ответ

2 голосов
/ 18 февраля 2010

xml.sax.saxutils.unescape (data [, entity]): Unescape '& amp', '& lt' и '& gt' в строке данных.

Вы можете удалить другие строки данных, передав словарь в качестве необязательного параметра entity. Ключи и значения должны быть строками; каждый ключ будет заменен соответствующим значением. '& amp', '& lt' и '& gt' всегда не экранированы, даже если предоставляются сущности.

...