Question

У меня есть вход (включая Unicode):

s = "Question1: a12 is the number of a, b1 is the number of cầu thủ"

Я хочу получить все слова, которые не содержат цифр и имеют более 2 символов, вывод желания:

['is', 'the', 'number', 'of', 'is', 'the', 'number', 'of', 'cầu', 'thủ'].

Я пробовал

re.compile('[\w]{2,}').findall(s)

и получил

'Question1', 'a12', 'is', 'the', 'number', 'of', 'b1', 'is', 'the', 'number', 'of', 'cầu', 'thủ'

Есть ли способ получить только слова без номера?

Wiktor Stribiżew · Answer 1 · 13 мая 2019

Вы можете использовать

import re
s = "Question1: a12 is the number of a, b1 is the number of cầu thủ"
print(re.compile(r'\b[^\W\d_]{2,}\b').findall(s))
# => ['is', 'the', 'number', 'of', 'is', 'the', 'number', 'of', 'cầu', 'thủ']

Или, если вы хотите ограничиться только ASCII-буквами, состоящими не менее чем из двух букв:

print(re.compile(r'\b[a-zA-Z]{2,}\b').findall(s))

См. Демонстрационную версию Python

Подробности

Для сопоставления только букв необходимо использовать [^\W\d_] (или r'[a-zA-Z] вариант только для ASCII)
Чтобы соответствовать целым словам, вам нужны границы слов, \b
Чтобы убедиться, что вы определяете границы слов, а не символы возврата на одну позицию в шаблоне регулярных выражений, используйте необработанный строковый литерал, r'...'.

Итак, r'\b[^\W\d_]{2,}\b' определяет регулярное выражение, которое соответствует границе слова, двум или более буквам, а затем утверждает, что после этих двух букв нет слова char.

Chris · Answer 2 · 13 мая 2019

Использование str.isalpha:

s = "Question1: a12 is the number of a, b1 is the number of cầu thủ"
[c for c in re.findall('\w{2,}', s) if c.isalpha()]

Выход:

['is', 'the', 'number', 'of', 'is', 'the', 'number', 'of', 'cầu', 'thủ']

Как получить все слова определенной длины, которые не содержат числа?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить все слова определенной длины, которые не содержат числа?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов