Извлеките все уникальные URL из журнала, используя sed - PullRequest
0 голосов
/ 18 февраля 2020

Можете ли вы помочь мне с правильным регулярным выражением с точки зрения синтаксиса sed? На данный момент каждое регулярное выражение, которое я могу написать, помечено терминалом как недействительное.

1 Ответ

1 голос
/ 18 февраля 2020

Если ваш синтаксис журнала одинаков, используйте эту команду

cut -f4 -d\" < logfile | sort -u 

Если вы хотите пропустить строку запроса из уникальности, используйте эту

cut -f4 -d\" < logfile | cut -f1 -d\? | sort -u 

Объяснение

Отфильтруйте вывод с помощью команды cut , возьмите 4-е поле ( -f4 ), используя "в качестве разделителя ( -d \" ). То же самое со вторым фильтром, используя? в качестве разделителя

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...