У меня есть текстовый файл с именами каталогов (по одному в строке), и мне нужно открыть и просмотреть этот список.Принимая одно имя за раз, загружая соответствующую HTML-страницу и извлекая «item_id», который находится на странице.
Идентификатор элемента отображается следующим образом в HTML: ?item_id=55963573">
.
Это то, что у меня так далеко внизу.
#!/bin/sh
for productID in (catIDs.txt) #I know this part is not correct
do
wget -q -U Mozilla "http://www.example.com/$productID/" -O - \
| tr '"' '\n' | grep "^item_id" | cut -d ' ' -f 4 >> itemIDs.txt
sleep 15
done