#/bin/bash
for page in {1..50}
do
wget -q "http://site.com/xap/wp7?p=$page" -O - \
| tr '"' '\n' | grep "^Free Shipping " | cut -d ' ' -f 3 > products.txt
done
tr превращает каждую двойную кавычку в новую строку, поэтому вывод tr будет выглядеть примерно так:
<html>
...
... <tag title=
Free Shipping [Product]
> ...
По сути, это способ поместить каждый Продукт в отдельную линию.
Затем grep пытается отбросить все остальные строки, кроме тех, которые начинаются с бесплатной доставки, поэтому его вывод должен выглядеть следующим образом:
Free Shipping [Product1]
Free Shipping [Product2]
...
Затем cut извлекает третий «столбец» (разделенный пробелами), поэтому на выходе должно быть:
[Product1]
[Product2]
...