Давайте предположим, что есть уже упорядоченный список доменов, например:
tld.aa.
tld.aa.do.notshowup.0
tld.aa.do.notshowup.0.1
tld.aa.do.notshowup.0.1.1
tld.aa.do.notshowup.too
tld.bb.showup
tld.aaaaa.showup
tld.xxxxx.
tld.xxxxx.donotshowup
tld.yougettheidea.dontyou
tld.yougettheidea.dontyou.thankyou
, который позже действует как черный список.
По конкретному требованию - все строки с завершающим символом '.'указать, что все более глубокие субдомены этого конкретного домена не должны появляться в самом черном списке ... так что желаемый результат приведенного выше примера будет / должен быть:
tld.aa.
tld.bb.showup
tld.aaaaa.showup
tld.xxxxx.
tld.yougettheidea.dontyou
tld.yougettheidea.dontyou.thankyou
В настоящее время я запускаю это в цикле (чистый bash + интенсивное использование встроенных встроенных команд bash для ускорения работы) ... но по мере роста списка требуется довольно много времени для обработки около 562 тыс. записей.
Разве это не должно быть легко для AWK (или, возможно, sed)чтобы сделать это - любая помощь очень ценится (я уже пробовал некоторые вещи в awk, но почему-то не смог отобразить то, что я хочу ...).
Спасибо!