Question

У меня есть текстовое поле, где пользователи могут писать что угодно.

Например:

Lorem Ipsum - просто фиктивный текст. http://www.youtube.com/watch?v=DUQi_R4SgWo печати и набора текста промышленность. Лорем Ипсум был стандартный фиктивный текст в отрасли с 1500-х годов, когда неизвестно Принтер взял камбуз типа и скремблировал, чтобы сделать типовой образец книга. Сохранилось не только пять веками, но и скачок в электронный набор текста, оставшийся практически без изменений. http://www.youtube.com/watch?v=A_6gNZCkajU&feature=relmfu Он был популяризирован в 1960-х годах с выпуск листов Letraset содержащие пассажи Lorem Ipsum, и совсем недавно с настольными изданиями программное обеспечение, такое как Aldus PageMaker включая версии Lorem Ipsum.

Теперь я хотел бы проанализировать его и найти все URL-адреса видео YouTube и их идентификаторы.

Есть идеи, как это работает?

ridgerunner · Answer 1 · 29 апреля 2011

URL видео YouTube может встречаться в различных форматах:

последний короткий формат: http://youtu.be/NLqAF9hrVbY
iframe: http://www.youtube.com/embed/NLqAF9hrVbY
iframe (безопасный): https://www.youtube.com/embed/NLqAF9hrVbY
параметр объекта: http://www.youtube.com/v/NLqAF9hrVbY?fs=1&hl=en_US
вставка объекта: http://www.youtube.com/v/NLqAF9hrVbY?fs=1&hl=en_US
часы: http://www.youtube.com/watch?v=NLqAF9hrVbY
пользователи: http://www.youtube.com/user/Scobleizer#p/u/1/1p3vcRhsYGo
ytscreeningroom: http://www.youtube.com/ytscreeningroom?v=NRHVzbJVx8I
любая / вещь / идет !: http://www.youtube.com/sandalsResorts#p/c/54B8C800269D7C1B/2/PPS-8DMrAn4
any / subdomain / too: http://gdata.youtube.com/feeds/api/videos/NLqAF9hrVbY
больше параметров: http://www.youtube.com/watch?v=spDj54kf-vY&feature=g-vrec
запрос может иметь точку: http://www.youtube.com/watch?v=spDj54kf-vY&feature=youtu.be
домен nocookie: http://www.youtube-nocookie.com

Вот функция PHP с регулярным выражением с комментариями, которая соответствует каждой из этих форм URL и преобразует их в ссылки (если они уже не являются ссылками):

// Linkify youtube URLs which are not already links.
function linkifyYouTubeURLs($text) {
    $text = preg_replace('~(?#!js YouTubeId Rev:20160125_1800)
        # Match non-linked youtube URL in the wild. (Rev:20130823)
        https?://          # Required scheme. Either http or https.
        (?:[0-9A-Z-]+\.)?  # Optional subdomain.
        (?:                # Group host alternatives.
          youtu\.be/       # Either youtu.be,
        | youtube          # or youtube.com or
          (?:-nocookie)?   # youtube-nocookie.com
          \.com            # followed by
          \S*?             # Allow anything up to VIDEO_ID,
          [^\w\s-]         # but char before ID is non-ID char.
        )                  # End host alternatives.
        ([\w-]{11})        # $1: VIDEO_ID is exactly 11 chars.
        (?=[^\w-]|$)       # Assert next char is non-ID or EOS.
        (?!                # Assert URL is not pre-linked.
          [?=&+%\w.-]*     # Allow URL (query) remainder.
          (?:              # Group pre-linked alternatives.
            [\'"][^<>]*>   # Either inside a start tag,
          | </a>           # or inside <a> element text contents.
          )                # End recognized pre-linked alts.
        )                  # End negative lookahead assertion.
        [?=&+%\w.-]*       # Consume any URL (query) remainder.
        ~ix', '<a href="http://www.youtube.com/watch?v=$1">YouTube link: $1</a>',
        $text);
    return $text;
}

; // Конец $ YouTubeId.

А вот версия JavaScript с точно таким же регулярным выражением (с удаленными комментариями):

// Linkify youtube URLs which are not already links.
function linkifyYouTubeURLs(text) {
    var re = /https?:\/\/(?:[0-9A-Z-]+\.)?(?:youtu\.be\/|youtube(?:-nocookie)?\.com\S*?[^\w\s-])([\w-]{11})(?=[^\w-]|$)(?![?=&+%\w.-]*(?:['"][^<>]*>|<\/a>))[?=&+%\w.-]*/ig;
    return text.replace(re,
        '<a href="http://www.youtube.com/watch?v=$1">YouTube link: $1</a>');
}

Примечания:

Часть VIDEO_ID URL-адреса захвачена в одной-единственной группе захвата: $1.
Если вы знаете, что ваш текст не содержит предварительно связанных URL-адресов, вы можете безопасно удалить отрицательное предварительное утверждение, которое проверяет это условие (утверждение, начинающееся с комментария: "URL-адрес утверждения предварительно не связан . ") Это несколько ускорит регулярное выражение.
Строка замены может быть изменена в соответствии с требованиями. Приведенный выше просто создает ссылку на общий URL-адрес в стиле "http://www.youtube.com/watch?v=VIDEO_ID" и устанавливает для текста ссылки: "YouTube link: VIDEO_ID".

Редактировать 2011-07-05: Добавлено - дефис для идентификатора класса char

Изменить 2011-07-17: Исправлено регулярное выражение для использования любой оставшейся части (например, запрос ) URL-адреса, следующего за идентификатором YouTube. Добавлен 'i' ignore-case модификатор. Переименована функция в camelCase. Усовершенствованный предварительный тест на просмотр.

Редактировать 2011-07-27: Добавлены новые форматы URL-адресов YouTube для пользователей и ytscreeningroom.

Редактировать 2011-08-02: Упрощенный / обобщенный для обработки новых URL-адресов "все / что-нибудь / идет" YouTube.

Редактировать 2011-08-25: Несколько модификаций:

Добавлена версия JavaScript: linkifyYouTubeURLs() функция.
В предыдущей версии часть схемы (протокол HTTP) была необязательной и, следовательно, соответствовала бы недействительным URL-адресам. Сделана схема обязательной части.
Предыдущая версия использовала привязку границы слова \b вокруг VIDEO_ID. Однако это не будет работать, если VIDEO_ID начинается или заканчивается с чертой -. Исправлено, чтобы справиться с этим условием.
Изменено выражение VIDEO_ID, поэтому оно должно быть ровно 11 символов.
В предыдущей версии не удалось исключить предварительно связанные URL-адреса, если у них была строка запроса, следующая за VIDEO_ID. Исправлено негативное предположение, чтобы исправить это.
Добавлены + и % в строку запроса, соответствующую классу символов.
Изменен разделитель регулярных выражений версии PHP с: % на: ~.
Добавлен раздел «Заметки» с некоторыми удобными заметками.

Изменить 2011-10-12: Часть хоста URL-адреса YouTube теперь может иметь любой поддомен (не только www.).

Изменить 2012-05-01: В разделе «Использовать URL» теперь можно указывать «-».

Редактировать 2013-08-23: Добавлен дополнительный формат, предоставляемый @Mei. (Часть запроса может иметь . точку.

Редактировать 2013-11-30: Добавлен дополнительный формат, предоставляемый @CRONUS: youtube-nocookie.com.

Редактировать 2016-01-25: Исправлено регулярное выражение для обработки ошибки, предоставленной CRONUS.

Christof · Answer 2 · 29 апреля 2011

Вот метод, который я однажды написал для проекта, который извлекает видео ключи YouTube и Vimeo:

/**
 *  strip important information out of any video link
 *
 *  @param  string  link to a video on the hosters page
 *  @return mixed  FALSE on failure, array on success
 */
function getHostInfo ($vid_link)
{
  // YouTube get video id
  if (strpos($vid_link, 'youtu'))
  {
    // Regular links
    if (preg_match('/(?<=v\=)([\w\d-_]+)/', $vid_link, $matches))
      return array('host_name' => 'youtube', 'original_key' => $matches[0]); 
    // Ajax hash tag links
    else if (preg_match('§([\d\w-_]+)$§i', $vid_link, $matches))
      return array('host_name' => 'youtube', 'original_key' => $matches[0]);
    else
      return FALSE;
  }
  // Vimeo get video id
  elseif (strpos($vid_link, 'vimeo'))
  {
    if (preg_match('§(?<=/)([\d]+)§', $vid_link, $matches))
      return array('host_name' => 'vimeo', 'original_key' => $matches[0]); 
    else
      return FALSE;
  }
  else
    return FALSE;
}

Найдите регулярное выражение, которое извлечет все ссылки из текста.Google поможет вам в этом.
Зациклите все ссылки и вызовите getHostInfo () для каждого

ezwrighter · Answer 3 · 02 мая 2012

Хотя ответ Ridgerunner является основой для моего ответа, он НЕ решает все URL-адреса, и я не верю, что он способен на это из-за множества возможных совпадений VIDEO_ID в URL-адресе YouTube. Мое регулярное выражение включает в себя его агрессивный подход в качестве последнего средства, но сначала пытается все общие совпадения, что значительно снижает вероятность неправильного совпадения позже в URL.

Это регулярное выражение:

/https?:\/\/(?:[0-9A-Z-]+\.)?(?:youtu\.be\/|youtube\.com(?:\/embed\/|\/v\/|\/watch\?v=|\/ytscreeningroom\?v=|\/feeds\/api\/videos\/|\/user\S*[^\w\-\s]|\S*[^\w\-\s]))([\w\-]{11})[?=&+%\w-]*/ig;

Обрабатывает все случаи, на которые изначально ссылаются в примерах ridgerunners, плюс любой URL, который может иметь последовательность из 11 символов позже в URL. т.е.:

http://www.youtube.com/watch?v=GUEZCxBcM78&feature=pyv&feature=pyv&ad=10059374899&kw=%2Bwingsuit

Вот рабочий пример, в котором проверяются все примеры URL-адресов YouTube:

http://jsfiddle.net/DJSwc/5/

stema · Answer 4 · 29 апреля 2011

Попробуйте

[^\s]*youtube\.com[^\s]*?v=([-\w]+)[^\s]*

Вы найдете идентификаторы видео 'в первой группе захвата.Что я не знаю, что такое действительный идентификатор видео?На данный момент я проверяю v= и фиксирую все -A-Za-z0-9_.

Я проверил его онлайн здесь, на Rubular с вашей строкой образца.

n00b · Answer 5 · 29 апреля 2011

Хорошо, я сделал свою собственную функцию. Но я считаю, что это довольно неэффективно. Любые улучшения приветствуются:

function get_youtube_videos($string) {

    $ids = array();

    // Find all URLs
    preg_match_all('/(http|https)\:\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(\/\S*)?/', $string, $links);

    foreach ($links[0] as $link) {
        if (preg_match('~youtube\.com~', $link)) {
            if (preg_match('/[^=]+=([^?]+)/', $link, $id)) {
                $ids[] = $id[1];
            }
        }
    }
    return $ids;
}

Noor Khan · Answer 6 · 29 апреля 2011

Использование:

<?php

    // The YouTube URL string

    $youtube_url='http://www.youtube.com/watch?v=8VtUYvwktFQ';

    // Use regex to get the video ID

    $regex='#(?<=v=)[a-zA-Z0-9-]+(?=&)|(?<=[0-9]/)[^&\n]+|(?<=v=)[^&\n]+#';

    preg_match($regex, $youtube_url, $id);

    // Plug that into our HTML
?>

Lee Woodman · Answer 7 · 24 мая 2015

Автор оригинала спросил: «Я хотел бы проанализировать его и найти все URL-адреса видео YouTube и их идентификаторы». Я переключил самый популярный ответ выше на preg_match и вернул идентификатор видео и URL.

Получить URL и идентификатор YouTube из сообщения:

$match[0] = Full URL
$match[1] = video ID

function get_youtube_id($input) {
    $input = preg_match('~https?://(?:[0-9A-Z-]+\.)?(?:youtu\.be/|youtube(?:-nocookie)?\.com\S*[^\w\s-])([\w-]{11})(?=[^\w-]|$)(?![?=&+%\w.-]*(?:[\'"][^<>]*>|</a>))[?=&+%\w.-]*~ix',
                        $input, $match);
    return $match;
}

B L Praveen · Answer 8 · 12 ноября 2014

Я попробовал простое выражение, чтобы получить только видеоид:

[?&]v=([^&#]*)

Проверьте, работает ли он онлайн здесь, на phpliveregex .

Sravya Singh · Answer 9 · 26 февраля 2018

String urlid="" ;
String  url="http://www.youtube.com/watch?v=0zM4nApSvMg#t=0m10s";
Pattern pattern =Pattern.compile("(?:http|https|)(?::\\/\\/|)(?:www.|)(?:youtu\\.be\\/|youtube\\.com(?:\\/embed\\/|\\/v\\/|\\/watch\\?v=|\\/ytscreeningroom\\?v=|\\/feeds\\/api\\/videos\\/|\\/user\\\\S*[^\\w\\-\\s]|\\S*[^\\w\\-\\s]))([\\w\\-\\_]{11})[a-z0-9;:@#?&%=+\\/\\$_.-]*");
Matcher result = pattern.matcher(url);
    if (result.find())
    {
         urlid=result.group(1);

    }

Этот код в Java в настоящее время работает абсолютно хорошо для всех URL-адресов YouTube.

Mukesh Kumar Bijarniya · Answer 10 · 19 июня 2014

Легко найти ссылку на YouTube из строки:

function my_url_search($se_action_data)
{
    $regex = '/https?\:\/\/[^\" ]+/i';
    preg_match_all($regex, $se_action_data, $matches);
    $get_url=array_reverse($matches[0]);
    return array_unique($get_url);
}
echo my_url_search($se_action_data)

Как найти все идентификаторы видео YouTube в строке с помощью регулярных выражений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти все идентификаторы видео YouTube в строке с помощью регулярных выражений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов