Скажем, я читаю прямо из документа HTML в моем коде.Каждая строка выглядит примерно так:
<TD>field1</TD><TD><A HREF="http://sample.url.com">field2</TD><TD><EM>field3</EM></TD>
Я хочу написать код, который может легко выбирать поля field1
, field2
и field3
.Я знаю, что каждая строка этой таблицы будет иметь точно такой же формат, кроме каждого из этих полей.
Я не так хорошо знаком с регулярным выражением, но в своем исследовании я только видел, как оно использовало для поиска для поиска известных токенов среди неизвестных токенов, а не изоляции неизвестные токены среди известных токенов.Из-за моей неопытности в регулярных выражениях мой пример будет по существу следовать шаблону форматирования строки C (используя %s
для входного токена).
Итак, я хочу реализовать следующий метод с помощью регулярных выражений:
(field1, url, field2, field3) = regex_extract('<TD>%s</TD><TD><A HREF="%s">%s</TD><TD><EM>%s</EM></TD>')
Это возможно с помощью регулярных выражений?