Я считаю, что вам понадобится список всех суффиксов, используемых после доменного имени.
http://publicsuffix.org/list/ предоставляет актуальную (или так утверждают) все суффиксы, используемые в настоящее время.
Список на самом деле здесь
Теперь идея состоит в том, чтобы вы разбили этот список на структуру с различными уровнями, разделенными точкой, начиная с конечных уровней:
так, например, для доменов:
com.la
com.tr
com.lc
вы получите:
[la]=>[com]
[lc]=>[com]
и т.д ...
Тогда вы получите хост из base_url (используя parse_url) и взорвите его точками. и вы начинаете сопоставлять значения с вашей структурой, начиная с последней:
так что для google.com.tr вы начнете с сопоставления tr, затем com, после чего не найдете совпадения, как только попадете в Google, что вам и нужно ...