У меня есть следующие строки в файлах:
a class="rss tip" rel="direct" title="Linq2Sql" href="http://feeds2.feedburner.com/pippo_ORM"></a> a class="rss tip" title="ORM" href="http://feeds2.feedburner.com/pippo_ORM" rel="nofollow"></a> a class="rss tip" rel="boh" title="Nhibernate" href="http://feeds2.feedburner.com/pippo_ORM"></a> a class="rss tip" rel="direct" title="Linq2Sql" href="http://pippo.it/pippo_ORM"></a> a class="rss tip" title="Linq2Sql" href="http://pippo.it/pippo_ORM"></a> <a class="rss tip" title="direct" href="pippo"></a>
Мне нужно получить все якоря, которые не имеют URL "pippo.it" в href. Я хотел бы удалить строки, содержащие слово rel = "direct", из результата.
Как я могу это сделать?
Я использую RegexBuddy, и мне нужно поместить код в консольную программу .NET. Мне нужно искать строки по всему файлу.
Tnx
grep -v 'href="[^"]*pippo.it\|rel="direct"' file.txt
awk '!/rel=\"direct\"/ && !/href.*pippo.it/s' file
Что-то вроде этого должно сделать
grep -v "pippo.it" myfile.txt | grep -v "rel=\"direct\""
-v инвертирует совпадение, поэтому строки без шаблона выводятся