Question

Учитывая шаблон p и строку s, предположим, что p в нижнем регистре.Что из следующих двух более эффективно?

r = re.compile(r'p', RE.IGNORECASE)
r.match(s)

... или ...

r = re.compile(r'p')
r.match(s.lower())

Chris B. · Answer 1 · 03 июля 2010

Это действительно будет зависеть от языка и движка.s.lower() и re.IGNORECASE, как правило, работают медленно, потому что они пытаются работать со строками локализации или Unicode (см. этот вопрос ).Если пакет регулярных выражений, который вы используете, имеет дело с этим, а метод s.lower() - нет, то метод s.lower() - явный выигрыш.И наоборот.

В целом, я бы ожидал, что метод s.lower() будет быстрее (он, как правило, более оптимизирован, чем сопоставление регулярным выражениям).Но в приведенном примере ...

r = re.compile(r'[Pp]')
r.match(s)

... будет быстрее, чем любой из них.

регулярное выражение: эффективность сравнения без учета регистра

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

регулярное выражение: эффективность сравнения без учета регистра

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов