Негативный взгляд в будущее - PullRequest
10 голосов
/ 31 марта 2012

Я бы хотел, чтобы регулярное выражение совпадало с последовательностью байтов, когда строка '02 d0 'не встречается в определенной позиции в строке. Позиция, в которой эта строка из двух байтов не может появиться, представляет собой позиции байтов 6 и 7, начиная с 0-го байта с правой стороны.

Это то, что я использовал для тестирования:

#!/usr/bin/python
import re

p0 = re.compile('^24 [\da-f]{2} 03 (01|03) [\da-f]{2} [\da-f]{2} [\da-f]{2} (([^0])|    (0[^2])|(02 [^d])|(02 d[^0])) 01 c2 [\da-f]{2} [\da-f]{2} [\da-f]{2} 23')
p1 = re.compile('^24 [\da-f]{2} 03 (01|03) [\da-f]{2} [\da-f]{2} [\da-f]{2} (([^0])|(0[^2])|(02 [^d])|(02 d[^0])) 01')
p2 = re.compile('^24 [\da-f]{2} 03 (01|03) [\da-f]{2} [\da-f]{2} [\da-f]{2} (([^0])|(0[^2])|(02 [^d])|(02 d[^0]))')
p3 = re.compile('^24 [\da-f]{2} 03 (01|03) [\da-f]{2} [\da-f]{2} [\da-f]{2} (?!02 d0) 01')
p4 = re.compile('^24 [\da-f]{2} 03 (01|03) [\da-f]{2} [\da-f]{2} [\da-f]{2} (?!02 d0)')

yes = '24 0f 03 01 42 ff 00 04 a2 01 c2 00 c5 e5 23'
no  = '24 0f 03 01 42 ff 00 02 d0 01 c2 00 c5 e5 23'

print p0.match(yes)  # fail
print p0.match(no)   # fail
print '\n'
print p1.match(yes)  # fail
print p1.match(no)   # fail
print '\n'
print p2.match(yes)  # PASS
print p2.match(no)   # fail
print '\n'
print p3.match(yes)  # fail
print p3.match(no)   # fail
print '\n'
print p4.match(yes)  # PASS
print p4.match(no)   # fail

Я посмотрел на этот пример , но этот метод менее строг, чем мне нужно. Может ли кто-нибудь объяснить, почему я могу правильно сопоставить только тогда, когда отрицательный взгляд вперед находится в конце строки? Что мне нужно сделать, чтобы соответствовать, когда '02 d0 'не встречается в этой конкретной битовой позиции?

1 Ответ

16 голосов
/ 31 марта 2012

Lookaheads имеют «нулевую ширину», то есть они не потребляют никаких символов. Например, эти два выражения никогда не будут совпадать:

  1. (?=foo)bar
  2. (?!foo)foo

Чтобы убедиться, что число не является каким-то конкретным числом, вы можете использовать:

(?!42)\d\d # will match two digits that are not 42

В вашем случае это может выглядеть так:

(?!02)[\da-f]{2} (?!0d)[\da-f]{2}

или

(?!02 d0)[\da-f]{2} [\da-f]{2}
...