получение телефонных номеров с периодами с использованием регулярных выражений - PullRequest
0 голосов
/ 03 октября 2019
import re
s = ' 1.210.223.1112 (113)-945-6373; 222.212.2333 (111)123-4567 (111)1234567 (111 )123-4567 \n(1-100-533-1710)the  ( 111)123-4567 Z1902022 (111)123-4567 N18-2181 Z1234567 1-22-2001 (100) 115-5198 f: (110)-111-1111 112.222.1112 (222)-222-3337 (120) 305-1314' 

У меня есть список телефонных номеров, и я хотел бы получить все варианты в строке s. Из модификации выбора вариантов телефонных номеров с помощью регулярных выражений я попробовал следующее

reg = r'\(?\s*\d?\s*-?\d{3}\s*[)-]?-?\s*\d{3}\s*-?\s*\d{4}\)?'
r1 = re.findall(reg,s)
r1

, что дает мне близкое к тому, что я хочу

['(113)-945-6373',
 '(111)123-4567',
 '(111)1234567',
 '(111 )123-4567',
 '(1-100-533-1710)',
 '( 111)123-4567',
 '(111)123-4567',
 '(100) 115-5198',
 '(110)-111-1111',
 '(222)-222-3337',
 '(120) 305-1314']

Однако, этоотсутствует 1.210.223.1112 и 222.212.2333.

Я попытался изменить reg, добавив ., но это не дает мне того, что я ищу

reg = r'\(?\s.*\d?\s*-?\d{3}\s*[)-]?-?\s*\d{3}\s*-?\s*\d{4}\)?'

Мой желаемый результат следующий, который включает 1.210.223.1112 и 222.212.2333

['1.210.223.1112',
 '(113)-945-6373',
  '222.212.2333',
 '(111)123-4567',
 '(111)1234567',
 '(111 )123-4567',
 '(1-100-533-1710)',
 '( 111)123-4567',
 '(111)123-4567',
 '(100) 115-5198',
 '(110)-111-1111',
 '(222)-222-3337',
 '(120) 305-1314']

Как мне изменить reg, чтобы получить желаемый результат?

Ответы [ 2 ]

3 голосов
/ 03 октября 2019

Вы были близки, просто добавьте необязательное совпадение точек \.?, когда вы ищете -, а также отделите регистр, когда у вас есть ( whitespace и пробел перед номером:

(?:(?:\(\s)|\(?\d?)-?\.?\d{3}\s*[)-]?-?\.?\s*\d{3}\s*-?\.?\s*\d{4}\)?

Regex Demo

Эквивалент, но с использованием OR | и несоответствующих групп:

(?:(?:\(\s)|\(?\d?)(?:-|\.)?\d{3}\s*[)-]?(?:-|\.)?\s*\d{3}\s*(?:-|\.)?\s*\d{4}\)?

Regex Demo

Выход:

['1.210.223.1112',
 '(113)-945-6373',
 '222.212.2333',
 '(111)123-4567',
 '(111)1234567',
 '(111 )123-4567',
 '1-100-533-1710',
 '( 111)123-4567',
 '(111)123-4567',
 '(100) 115-5198',
 '(110)-111-1111',
 '112.222.1112',
 '(222)-222-3337',
 '(120) 305-1314']
0 голосов
/ 03 октября 2019
re.findall(r'(?:\b\d[.-])?\(?\s?\d{3}[.) -]{0,2}\d{3}[ .-]?\d{4}',s)
Out[31]: 
['1.210.223.1112',
 '(113)-945-6373',
 ' 222.212.2333',
 '(111)123-4567',
 '(111)1234567',
 '(111 )123-4567',
 '1-100-533-1710',
 '( 111)123-4567',
 '(111)123-4567',
 '(100) 115-5198',
 '(110)-111-1111',
 ' 112.222.1112',
 '(222)-222-3337',
 '(120) 305-1314']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...