У меня явно простой запрос регулярных выражений для каналов - мне нужно обрезать каждый элемент по его тегу (<img>
) и далее. Я думал, что цикл с регулярным выражением строки <img[.]*
, замененным пустым полем, позаботился бы об этом, но безрезультатно.
Очевидно, я упускаю что-то базовое здесь - кто-то может указать на это?
Предмет в том виде, в котором он стоит, выглядит примерно так:
sample text title
<a rel="nofollow" target="_blank" href="http://example.com"><img border="0" src="http://example.com/image.png" alt="Yes" width="20" height="23"/></a>
<a.... (a bunch of irrelevant hyperlinks I don't need)...
По сути, мне нужен только текст заголовка и гиперссылка, поэтому я отключаю все остальное
Идем лучше, потому что все, что я на самом деле здесь делаю, - это сделать строку элемента более управляемой, урезая ее перед дальнейшими манипуляциями - любой знает, возможно ли извлечь href из определенной ссылки на странице (в данном случае 1-й) использовать Regex в Yahoo Pipes? Я видел ответ регулярного выражения на этот SO q , но я не уверен, как использовать его для сопоставления URL-адреса с атрибутом элемента в модуле Pipes?