Шаблон RegEx для получения идентификатора видео YouTube с любого URL YouTube - PullRequest
8 голосов
/ 07 марта 2012

Давайте возьмем эти URL в качестве примера:

  1. http://www.youtube.com/watch?v=8GqqjVXhfMU&feature=youtube_gdata_player
  2. http://www.youtube.com/watch?v=8GqqjVXhfMU

Эта функция PHP НЕ будет правильно получать идентификатор в случае 1, но будет в случае 2. Случай 1 очень распространен, когда НИЧЕГО может быть за идентификатором YouTube.

/**
 * get YouTube video ID from URL
 *
 * @param string $url
 * @return string YouTube video id or FALSE if none found. 
 */
function youtube_id_from_url($url) {
    $pattern = 
        '%^# Match any YouTube URL
        (?:https?://)?  # Optional scheme. Either http or https
        (?:www\.)?      # Optional www subdomain
        (?:             # Group host alternatives
          youtu\.be/    # Either youtu.be,
        | youtube\.com  # or youtube.com
          (?:           # Group path alternatives
            /embed/     # Either /embed/
          | /v/         # or /v/
          | /watch\?v=  # or /watch\?v=
          )             # End path alternatives.
        )               # End host alternatives.
        ([\w-]{10,12})  # Allow 10-12 for 11 char YouTube id.
        $%x'
        ;
    $result = preg_match($pattern, $url, $matches);
    if (false !== $result) {
        return $matches[1];
    }
    return false;
}

Что я думаю, так это то, что должен быть способ, в котором я могу просто найти «v =», независимо от того, где он находится в URL, и взять символы после этого. Таким образом, никаких сложных RegEx не потребуется. Это с базы? Есть идеи для начальных точек?

Ответы [ 9 ]

27 голосов
/ 20 марта 2012
if (preg_match('/youtube\.com\/watch\?v=([^\&\?\/]+)/', $url, $id)) {
  $values = $id[1];
} else if (preg_match('/youtube\.com\/embed\/([^\&\?\/]+)/', $url, $id)) {
  $values = $id[1];
} else if (preg_match('/youtube\.com\/v\/([^\&\?\/]+)/', $url, $id)) {
  $values = $id[1];
} else if (preg_match('/youtu\.be\/([^\&\?\/]+)/', $url, $id)) {
  $values = $id[1];
}
else if (preg_match('/youtube\.com\/verify_age\?next_url=\/watch%3Fv%3D([^\&\?\/]+)/', $url, $id)) {
    $values = $id[1];
} else {   
// not an youtube video
}

Это то, что я использую для извлечения идентификатора из URL-адреса YouTube. Я думаю, что это работает во всех случаях.

Обратите внимание, что в конце $ values ​​= id видео

9 голосов
/ 07 марта 2012

вместо регулярных выражений. Я настоятельно рекомендую parse_url() и parse_str():

$url = "http://www.youtube.com/watch?v=8GqqjVXhfMU&feature=youtube_gdata_player";
parse_str(parse_url( $url, PHP_URL_QUERY ), $vars );
echo $vars['v'];    

Готово

2 голосов
/ 07 марта 2012

Вы можете просто использовать parse_url и parse_str:

$query_string = parse_url($url, PHP_URL_QUERY);
parse_str($query_string);
echo $v;
1 голос
/ 07 октября 2013

Я использовал следующие шаблоны, потому что у YouTube тоже есть домен youtube-nocookie.com:

'@youtube(?:-nocookie)?\.com/watch[#\?].*?v=([^"\& ]+)@i',
'@youtube(?:-nocookie)?\.com/embed/([^"\&\? ]+)@i',
'@youtube(?:-nocookie)?\.com/v/([^"\&\? ]+)@i',
'@youtube(?:-nocookie)?\.com/\?v=([^"\& ]+)@i',
'@youtu\.be/([^"\&\? ]+)@i',
'@gdata\.youtube\.com/feeds/api/videos/([^"\&\? ]+)@i',

В вашем случае это будет означать только расширение существующих выражений с помощью необязательного (-nocookie) дляобычный URL-адрес YouTube.com выглядит следующим образом:

if (preg_match('/youtube(?:-nocookie)\.com\/watch\?v=([^\&\?\/]+)/', $url, $id)) {

Если вы измените предложенное выражение, чтобы НЕ содержать конечный $, оно должно работать так, как вы предполагали.Я также добавил -nocookie.

/**
 * get YouTube video ID from URL
 *
 * @param string $url
 * @return string YouTube video id or FALSE if none found. 
 */
function youtube_id_from_url($url) {
    $pattern = 
        '%^# Match any YouTube URL
        (?:https?://)?  # Optional scheme. Either http or https
        (?:www\.)?      # Optional www subdomain
        (?:             # Group host alternatives
          youtu\.be/    # Either youtu.be,
        |youtube(?:-nocookie)?\.com  # or youtube.com and youtube-nocookie
          (?:           # Group path alternatives
            /embed/     # Either /embed/
          | /v/         # or /v/
          | /watch\?v=  # or /watch\?v=
          )             # End path alternatives.
        )               # End host alternatives.
        ([\w-]{10,12})  # Allow 10-12 for 11 char YouTube id.
        %x'
        ;
    $result = preg_match($pattern, $url, $matches);
    if (false !== $result) {
        return $matches[1];
    }
    return false;
}
0 голосов
/ 30 июля 2015

Вот моя функция для получения идентификатора Youtube!

function getYouTubeId($url) {
    if (!(strpos($url, 'v=') !== false)) return false;
    $parse = explode('v=', $url);
    $code = $parse[1];
    if (strlen($code) < 11) return false;
    $code = substr($code, 0, 11);
    return $code;
}
0 голосов
/ 16 апреля 2014

Вот одно из решений

/**
 * credits goes to: http://stackoverflow.com/questions/11438544/php-regex-for-youtube-video-id
 * update: mobile link detection
 */
public function parseYouTubeUrl($url)
{
     $pattern = '#^(?:https?://)?(?:www\.)?(?:m\.)?(?:youtu\.be/|youtube\.com(?:/embed/|/v/|/watch\?v=|/watch\?.+&v=))([\w-]{11})(?:.+)?$#x';
     preg_match($pattern, $url, $matches);
     return (isset($matches[1])) ? $matches[1] : false;
}

Может работать и с мобильными ссылками.

0 голосов
/ 16 декабря 2013
0 голосов
/ 07 марта 2012

Предложения parse_url хороши.Если вы действительно хотите регулярное выражение, вы можете использовать это:

/(?<=v=)[^&]+/`
0 голосов
/ 07 марта 2012

Другим простым способом является использование parse_str():

<?php
    $url = 'http://www.youtube.com/watch?v=8GqqjVXhfMU&feature=youtube_gdata_player';
    parse_str($url, $yt);

    // The associative array $yt now contains all of the key-value pairs from the querystring (along with the base 'watch' URL, but doesn't seem you need that)
    echo $yt['v']; // echos '8GqqjVXhfMU';
?>
...