У меня есть строка, которую мне нужно проанализировать с помощью регулярных выражений.
Эта строка:
http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 Crachet 7/12
Я пытаюсь разделить URL и комментарий, поэтому я попытался:
(\ S +) \ s (. +)
но в результате я получаю:
$ 1 => http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 Crachet
$ 2 => 7/12
Итак, похоже, что первый символ не пробел!
Я попытался заменить \ s на 'X' и получил
http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 CrachetX7 / 12
У меня наверняка будет что-то странное.
Я пытался заменить каждый символ на 'X' (\ n, \ t и т. Д.), Но не могу найти, что это за "двойник"
Как мне определить этот символ и разбить мою строку?
EDIT:
Если вы хотите поиграть с моим кодом, это Yahoo! Труба: http://pipes.yahoo.com/pipes/pipe.edit?_id=a732be6cf2b7cb92cec5f9ee6ebca756
Согласно документации Pipes , похоже, что он использует довольно стандартный синтаксис регулярных выражений.
Некоторые тесты:
и