В моей строке есть символ, который я не могу опознать, который кажется пробелом (регулярное выражение) - PullRequest
0 голосов
/ 29 сентября 2011

У меня есть строка, которую мне нужно проанализировать с помощью регулярных выражений. Эта строка:

http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 Crachet 7/12

Я пытаюсь разделить URL и комментарий, поэтому я попытался:

(\ S +) \ s (. +) но в результате я получаю:

$ 1 => http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 Crachet

$ 2 => 7/12

Итак, похоже, что первый символ не пробел!

Я попытался заменить \ s на 'X' и получил

http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 CrachetX7 / 12

У меня наверняка будет что-то странное.

Я пытался заменить каждый символ на 'X' (\ n, \ t и т. Д.), Но не могу найти, что это за "двойник"

Как мне определить этот символ и разбить мою строку?

EDIT:

Если вы хотите поиграть с моим кодом, это Yahoo! Труба: http://pipes.yahoo.com/pipes/pipe.edit?_id=a732be6cf2b7cb92cec5f9ee6ebca756

Согласно документации Pipes , похоже, что он использует довольно стандартный синтаксис регулярных выражений.

Некоторые тесты:

enter image description here

и

enter image description here

1 Ответ

1 голос
/ 29 сентября 2011

Попробуйте регулярное выражение

^(\S+)\s+(.*)$

с установленными флажками модификатора g и m.

...