У меня есть рабочий скрипт Bash для извлечения тегов заголовков.Мне нужна помощь с разделителем полей AWK для извлечения мета-тегов из HTML, например:
<meta name="keywords" content="key1, key2, key3">
мой скрипт работает для извлечения заголовка, но meta name
не работает.
#!/bin/bash
for LINE in `cat htmls.txt`
do
echo $LINE
awk 'BEGIN{IGNORECASE=1;FS="<title>|</title>";RS=EOF} {print $2}' $LINE |
awk '{ if (NF > 0) printf("%s\n", $0); }'
done
Полагаю, мне нужно решение для регулярных выражений.Есть идеи?