Regexp, чтобы упростить заголовок Yahoo! - PullRequest
1 голос
/ 11 сентября 2010

Я пытаюсь разобрать канал ответов Yahoo - http://answers.yahoo.com/rss/allq Проблема в том, что заголовки имеют

[Категория]: Открытый вопрос:

в каждом названии, которое яне хочу ... Я хочу написать регулярное выражение для удаления этого ...

всего, что мы можем сделать, чтобы удалить все буквы в начале [и первое: должно это сделать.

после : также есть пробел, и его тоже нужно удалить.

Заранее спасибо за это, я тоже постараюсь найти решение.

Ответы [ 2 ]

1 голос
/ 11 сентября 2010

Рассматривали ли вы использование YQL службы Yahoo для анализа этого канала (или других веб-страниц)?

У них уже есть примеры запросов, которые вы можете получить на данных Yahoo Ответы:

(Просто к сведению весли вы не знали об этом удобном сервисе. Я использую его вместо скрининга экрана с помощью RegEx.)

1 голос
/ 11 сентября 2010

следующее регулярное выражение должно выполнять эту работу:

^\[.*?: 

Пример использования в c #:

string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");

То, что он делает, начинается с скобки [ и принимает любые символы дооно соответствует : и занимает следующий пробел.

Надеюсь, это поможет, Том.

Спасибо @ cmptrgeekken за то, что указали на не жадную вещь!

...