preg_match to domain.tld - PullRequest
       6

preg_match to domain.tld

3 голосов
/ 22 августа 2010

Как я могу получить строки, которые содержат только domain.tld?

if (preg_match('^(?:[-A-Za-z0-9]+\.)+[A-Za-z]{2,6}$', $domain))
echo "domain.tld found!";

, но для регулярного выражения ^(?:[-A-Za-z0-9]+\.)+[A-Za-z]{2,6}$ субдомены тоже подойдут. Но я просто хочу проверить "domain.tld". Какое регулярное выражение я должен использовать для этого?

Спасибо.

Ответы [ 3 ]

6 голосов
/ 22 августа 2010
if (preg_match('/^[-a-z0-9]+\.[a-z]{2,6}$/', strtolower($domain)))
  echo "domain.tld found!";

будет очевидным ответом.Вы всегда можете быть более конкретным в части tld, если хотите удалить ложные срабатывания:

if (preg_match('/^[-a-z0-9]+\.[a-z][a-z]|biz|cat|com|edu|gov|int|mil|net|org|pro|tel|aero|arpa|asia|coop|info|jobs|mobi|name|museum|travel$/', strtolower($domain)))
  echo "domain.tld found!";

Если вы хотите также указать ccTLD, вот текущий список:

if (preg_match('/^[-a-z0-9]+\.a[cdefgilmnoqrstuwxz]|b[abdefghijmnorstvwyz]|c[acdfghiklmnoruvxyz]|d[ejkmoz]|e[cegrstu]|f[ijkmor]|g[abdefghilmnpqrstuwy]|h[kmnrtu]|i[delmnoqrst]|j[emop]|k[eghimnprwyz]|l[abcikrstuvy]|m[acdeghklmnopqrstuvwxyz]|n[acefgilopruz]|om|p[aefghklmnrstwy]|qa|r[eosuw]|s[abcdeghijklmnortuvyz]|t[cdfghjklmnoprtvwz]|u[agksyz]|v[aceginu]|w[fs]|y[et]|z[amw]|biz|cat|com|edu|gov|int|mil|net|org|pro|tel|aero|arpa|asia|coop|info|jobs|mobi|name|museum|travel$/', strtolower($domain)))
  echo "domain.tld found!";

Я бы также принял интернационализированные TLD

xn--p1ai|xn--fiqs8s|xn--fiqz9s|xn--o3cw4h|xn--wgbh1c|xn--zckzah|xn--0zwm56d|xn--deba0ad|xn--g6w251d|xn--j6w193g|xn--kprw13d|xn--kpry57d|xn--pgbs0dh|xn--jxalpdlp|xn--kgbechtv|xn--fzc2c9e2c|xn--ygbi2ammx|xn--9t4b11yi5a|xn--mgbaam7a8h|xn--mgbayh7gpa|xn--80akhbyknj4f|xn--xkc2al3hye2a|xn--11b5bs3a9aj6g|xn--mgberp4a5d4ar|xn--hgbk6aj7f53bba|xn--hlcj6aya9esc7a

или, по крайней мере, xn--[a-z0-9]+.

Так что те, кто плюс .arpa дают

if (preg_match('^[-a-z0-9]+\.a[cdefgilmnoqrstuwxz]|b[abdefghijmnorstvwyz]|c[acdfghiklmnoruvxyz]|d[ejkmoz]|e[cegrstu]|f[ijkmor]|g[abdefghilmnpqrstuwy]|h[kmnrtu]|i[delmnoqrst]|j[emop]|k[eghimnprwyz]|l[abcikrstuvy]|m[acdeghklmnopqrstuvwxyz]|n[acefgilopruz]|om|p[aefghklmnrstwy]|qa|r[eosuw]|s[abcdeghijklmnortuvyz]|t[cdfghjklmnoprtvwz]|u[agksyz]|v[aceginu]|w[fs]|y[et]|z[amw]|biz|cat|com|edu|gov|int|mil|net|org|pro|tel|aero|arpa|asia|coop|info|jobs|mobi|name|museum|travel|arpa|xn--[a-z0-9]+$', strtolower($domain)))
1 голос
/ 22 августа 2010

Вы хотите найти определенный текст domain.tld, в то время как регулярное выражение с комбинацией A-Za-z0-9 классов символов будет соответствовать практически любому тексту. Почему бы вам просто не сделать:

if (strpos('domain.tld', $domain) !== false) {
  echo "domain.tld found!";
}
0 голосов
/ 21 октября 2013

для извлечения http://www.example.com из

something http://www.example.com/page/blabla.html some thingggggg

<?php
preg_match('/((http:||https:)\/\/.*?)[\/||\n||\s]/s', $f,$n);
echo $n[1];
?>
...