Как мне найти только целые слова, используя re.search? - PullRequest
2 голосов
/ 18 августа 2010

У меня есть список слов, созданный из разных HTML-страниц.Вместо того, чтобы писать правило за правилом, чтобы вырезать различные элементы, я пытаюсь просмотреть список и сказать, что это не полное слово с только буквенными символами, просто двигаться дальше.Это не работает.

for w in words:
     if re.search('\b[a-zA-Z]\b', w) == None:
          continue

Я ужасен с регулярными выражениями (если вы уже не можете сказать!), Поэтому я мог бы использовать некоторую помощь.Как бы я написал так, чтобы он проверял каждый w, чтобы убедиться, что в нем есть только a-zA-Z?

1 Ответ

3 голосов
/ 18 августа 2010

Ты почти у цели.Вы просто должны указать, что поиск соответствует целой строке из 1 или более символов.

for w in words:
     if re.search('^[a-zA-Z]+$', w) == None:
          continue

Другое решение (по крайней мере, для этого конкретного случая) будет использовать isalpha();

for w in words:
    if not w.isalpha():
          continue
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...