удалениеиз запроса GET - PullRequest
       11

удалениеиз запроса GET

0 голосов
/ 17 января 2011

Я использую запрос get, чтобы получить некоторые данные страницы, но мне нужно убрать теги разрыва из готового файла. По сути, я делаю вывод запроса get и сохраняю его в файл, но в нем есть множество тегов разрыва, которые мне нужно удалить. Я в порядке с запуском пакетного или виртуального сценария после сохранения файла, чтобы удалить теги, но я не уверен, как и как это сделать. Пока единственное решение, которое я видел, это удалить целые строки.

РЕДАКТИРОВАТЬ: Это будет развернуто на нескольких серверах Windows, поэтому я хотел бы сохранить требования как можно меньше. И.Е. команды / программное обеспечение, которое Windows имеет по умолчанию.

Ответы [ 2 ]

0 голосов
/ 17 января 2011

Если я не понял неправильно, вы можете заменить теги разрыва, используя функцию замены в vbscript (предполагается, что из тега).Например:

cleanedText = Replace(rawText,"<br/>",""))

Более подробную информацию об использовании можно найти здесь

http://www.w3schools.com/Vbscript/func_replace.asp

Следует отметить, что эта функция действует дословно, поэтому вам, возможно, придетсяПройдите несколько раз, чтобы получить всю общую разметку тега:

cleanedText = Replace(rawText,"<br/>","")) //no spaces
cleanedText = Replace(cleanedText,"<br />","")) // a space
cleanedText = Replace(cleanedText,"<br>","")) // unterminated
0 голосов
/ 17 января 2011

Если вы знакомы с Python, вы можете использовать Beautiful Soup для удаления <br /> элементов довольно надежным способом. См. здесь , чтобы узнать, как удалить элементы из дерева.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...