Я ищу регулярное выражение для извлечения слова, содержащего ТОЛЬКО алфавитно-цифровые символы:
string = 'This is a $dollar sign !!'
matches = re.findall(regex, string)
matches = ['This', 'is', 'sign']
Это может быть сделано путем токенизации строки и оценки каждого токена в отдельности с использованием следующего регулярного выражения:
^[a-zA-Z0-9]+$
Из-за проблем с производительностью я хочу иметь возможность извлекать буквенно-цифровые токены без токенизации всей строки. Самое близкое, что я получил, было
regex = \b[a-zA-Z0-9]+\b
, но все равно извлекает подстроки, содержащие буквенно-цифровые символы:
string = 'This is a $dollar sign !!'
matches = re.findall(regex, string)
matches = ['This', 'is', 'dollar', 'sign']
Есть ли регулярное выражение, способное это осуществить? Я пробовал разные вещи, но не могу найти решение.