Я хотел бы получить все хэштеги с помощью PHP из http://search.twitter.com/search.atom?q=%23eu-jele%C4%A1%C4%A1i
Хэштеги находятся в контенте, заголовочных узлах в ленте RSS. Они имеют префикс #
У меня проблема с неанглийскими буквами (вне диапазона a-zA-Z).
Если вы посмотрите на RSS-канал, а затем просмотрите html-источник, моя борьба может быть более ясной.
<title>And more: #eu-jeleġġi #eu-kiest #ue-wybiera #eu-eleger #ue-alege #eu-vyvolenej #eu-izvoli #eu-elegir #eu-välja #eu-elect</title>
Нужно ли что-то сделать с узлом заголовка, прежде чем я найду совпадения с rexexp.
Моя конечная цель - заменить хэштег на URL-адрес поиска в твиттере, например, http://search.twitter.com/search.atom?q=%23eu-jele%C4%A1%C4%A1i
Вот пример кода, который поможет вам в этом.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<body>
<?php
$title="And more: #eu-jeleġġi #eu-kiest #ue-wybiera #eu-eleger #ue-alege #eu-vyvolenej #eu-izvoli #eu-elegir #eu-välja #eu-elect";
// this is the regexp that hashtags.org use (http://twitter.pbwiki.com/Hashtags)
$r = preg_replace("/(?:(?:^#|[\s\(\[]#(?!\d\s))(\w+(?:[_\-\.\+\/]\w+)*)+)/"," <a href=\"http://search.twitter.com/search?q=%23\1\">\1</a> ", $title);
echo "<p>$r</p>";
$r = preg_replace("/(#.+?)(?:(\s|$))/"," <a href=\"http://search.twitter.com/search?q=\1\">\1</a> ", $title);
echo "<p>$r</p>";
// This is my desired end result
echo "<p><a href=\"http://search.twitter.com/search?q=%23eu-jeleġġi\">#eu-jeleġġi</a></p>";
?>
</body>
</html>
Любой совет или решение будет принята с благодарностью.