Получить слово до и после тире '-' для нескольких вхождений в строке - PullRequest
0 голосов
/ 31 мая 2019

Я пытаюсь разобрать иностранные (корейские) адреса. Часто адрес будет выглядеть примерно так:

Seoul, Gangnam-gu, South Korea

Я хочу быть в состоянии извлечь: Gangnam-gu - В основном слово, предшествующее и предшествующее тире.

Но бывают случаи, когда что-то подобное

Seoul, Itaewon-dong, Gangnam-gu, South Korea

Так что в этом случае я хотел бы иметь возможность извлечь ОБА: Itaewon-dong И Gangnam-gu

Я знаю, что с помощью REGEX я мог бы вытащить оба слова вокруг тире (-), хотя я не уверен, как. И вдобавок ко всему, я не знаю, как справиться со всеми событиями.

Ответы [ 2 ]

1 голос
/ 05 июня 2019

вы должны попытаться использовать grep:

grep -oh '\w*-\w*' aa.txt

результат:

Itaewon-dong
Gangnam-gu
1 голос
/ 31 мая 2019

это может служить:

([a-zA-Z]+)-([a-zA-Z]+)

Приветствия

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...