Вот что я быстро придумал.На iPhone он работает с regexKitLite
:
#define kUserRegex @"((?:@){1}[0-9a-zA-Z_]{1,15})";
В Twitter разрешены только буквы / цифры, подчеркивания _
и максимум 15 символов (без @
).Мое регулярное выражение выглядит хорошо, но сообщает о ложных срабатываниях на адресах электронной почты.
#define kHashtagRegex @"((?:#){1}[0-9a-zA-Z_àáâãäåçèéêëìíîïðòóôõöùúûüýÿ]{1,140})";
kHashtagRegex
работает с выделенными словами, но этого недостаточно для слов UTF-8.Что такое «техническая спецификация» хэштега?
Где-нибудь есть ссылка на то, что использовать для их анализа?Или у вас есть совет, как улучшить это регулярное выражение?