Question

Я пытаюсь написать код, используя regex и мой текстовый файл.Мой файл содержит эти слова построчно:

nana
abab
nanac
eded

Моя цель -;отображение слов, которые не содержат букв, которым даны буквы подстроки.

Например, если моей подстрокой является "bn", мой вывод должен быть только eded.Поскольку nana и nanac содержат «n», а abab содержит «b».

Я написал код, но он проверяет только первую букву моей подстроки.

import re
substring = "bn"
def xstring():
    with open("deneme.txt") as f:
        for line in f:
            for word in re.findall(r'\w+', line):
                for letter in substring:
                    if len(re.findall(letter, word)) == 0:
                        print(word)
                        #yield word
xstring()

Как мне решить эту проблему?

Emma · Answer 1 · 02 июня 2019

Здесь нам просто нужно иметь простое выражение, такое как:

^[^bn]+$

Мы добавляем b и n в не-char класс [^bn] и собираем все другие символызатем, добавив якоря ^ и $, мы будем пропускать все строки, которые могут иметь b и n.

Демонстрация

Тест

# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility

import re

regex = r"^[^bn]+$"

test_str = ("nana\n"
    "abab\n"
    "nanac\n"
    "eded")

matches = re.finditer(regex, test_str, re.MULTILINE)

for matchNum, match in enumerate(matches, start=1):

    print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))

    for groupNum in range(0, len(match.groups())):
        groupNum = groupNum + 1

        print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))

# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.

RegEx

Если это выражение не требуется, его можно изменить / изменитьin regex101.com .

RegEx Circuit

jex.im визуализирует регулярные выражения:

Cireo · Answer 2 · 02 июня 2019

@ Xosrov имеет правильный подход, с несколькими незначительными проблемами и опечатками.Ниже версия той же логики работает

import re

def xstring(substring, words):
    regex = re.compile('[%s]' % ''.join(sorted(set(substring))))
    # Excluding words matching regex.pattern
    for word in words:
        if not re.search(regex, word):
            print(word)

words = [
    'nana',
    'abab',
    'nanac',
    'eded',
]

xstring("bn", words)

Gilder · Answer 3 · 02 июня 2019

Возможно, это не самый эффективный способ, но вы можете попробовать что-то сделать с установленными пересечениями. Следующий сегмент кода напечатает значение в строковом слове, только если оно не содержит ни одной из букв «b» или «n»

if (not any(set(word) & set('bn'))):
        print(word)

Xosrov · Answer 4 · 02 июня 2019

Если вы хотите проверить, имеет ли строка набор букв, используйте скобки.
Например, использование [bn] будет соответствовать словам, которые содержат одну из этих букв.

import re
substring = "bn"
regex = re.compile('[' + substring + ']')
def xstring():
    with open("dename.txt") as f:
        for line in f:
            if(re.search(regex, line) is None):
                print(line)
xstring()

Как найти слова, не содержащие конкретные буквы?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Демонстрация

Тест

RegEx

RegEx Circuit

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти слова, не содержащие конкретные буквы?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Демонстрация

Тест

RegEx

RegEx Circuit

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы