Я новичок в Python, я пытался написать логику для извлечения номера телефона, который начинается с определенных кодов города (первые 3 цифры номера телефона) в данном файле данных. Мой код
Код
import re
data="This is the sample test data. 2247279133 224dfa7279133 dhana 5107279133 subha 123456789 "
pattern = re.compile(r"((224|510)\d{7})")
matches = pattern.findall(data)
for match in matches:
print (match[0])
Я получаю ожидаемый вывод, как показано ниже,
Вывод
2247279133
5107279133
Хотя я получаю ожидаемый результат, я хотел бы знать следующие вещи,
- Является ли этоэффективный способ?
- Можно ли передать список кодов областей в виде переменной массива вместо жесткого кодирования (224 | 510)?
- Каков рекомендуемый способ поиска таких телефонных номеровнад большим файлом 10 ГБ?