Я пытаюсь сопоставить соединения кандзи в японском предложении, используя регулярное выражение.
Прямо сейчас я использую / ((.)*) /
для сопоставления соединения с пробелом, например, 彼はそこに ひと人 でいた。
Проблема в том, что в каком-то предложении слово стоит в начале или сопровождается знаками препинания. Ex. いっ瞬 の間が生まれた。
или 一昨じつ、彼らはそこを出発した。
Я пробовал что-то вроде / ((.)*) |^((.)*) | ((.)*)、 etc.
Но это соответствует 彼はそこに ひと人
вместо ひと人
в 彼はそこに ひと人 でいた。
Можно ли как-нибудь упаковать все это в одно регулярное выражение, или мне нужно использовать одно, проверить, вернул ли он что-нибудь, а затем попробовать другое, если нет?
Спасибо!
P.S .: Я использую PHP для разбора предложений.