Question

Структура цели выглядит следующим образом:

検索結果: 100000 件

Если я использую следующий шаблон регулярных выражений:

((?<!検索結果：)(?<!次の)(((〇|一|二|三|四|五|六|七|八|九|十|百|千|万|億|兆|京+|[0-9０-９]))(,|，|、)?).+((〇|一|二|三|四|五|六|七|八|九|十|百|千|万|億|兆|京|[0-9０-９]).+)件)(?!表示)

Как видите, я хочу сопоставить все, что предшествует "検索結果：" и "次の", используя этот шаблон, за которым следуют либо арабские цифры, либо японские цифры кандзи (китайские иероглифы). Тем не менее, шаблон как-то соответствует до 4 цифр, но не 6 цифр.

Другими словами,

次の 1000 件

работает (значит, ничего не соответствует), но

次の 5,0000 件

дает частичное совпадение ("００００件")

Я хочу знать, почему до 4 цифр. И, в конечном счете, хочу найти способ НЕ сопоставлять что-либо с помощью этого регулярного выражения. Я знаю, что это регулярное выражение немного грязно. Заранее спасибо за ваш отзыв!

Michael · Answer 1 · 07 февраля 2019

Вот одна проблема, которую я вижу до сих пор:

販売実績 100 万件販売実績 100 万件販売実績 1000 件販売実績 1000 件販売実績 1000000 件です 100000 件 5000 件

Все они совпадают, но они фиксируют нерелевантную часть между двумя совпадающими образцами. Например,

販売実績 100 万件販売実績 100 万件

как одна строка будет соответствовать части, которая не должна соответствовать.

https://regex101.com/r/LfDPHE/1

Wiktor Stribiżew · Answer 2 · 16 января 2019

Вам нужно избегать совпадения чисел после цифры или цифры + разделитель, поэтому вам нужно добавить (?<![０-９0-9])(?<![０-９0-9][，,、]) сразу после (?<!次の):

(?<!検索結果：)(?<!次の)(?<![０-９0-9])(?<![０-９0-9][，,、])(?:[〇一二三四五六七八九十百千万億兆0-9０-９]|京+)[,，、]?.+[〇一二三四五六七八九十百千万億兆京0-9０-９].+件
                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

См. Демоверсию regex .

Попытка НЕ соответствовать японскому слову, используя отрицательный внешний вид RegEx

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Попытка НЕ ​​соответствовать японскому слову, используя отрицательный внешний вид RegEx

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы

Попытка НЕ соответствовать японскому слову, используя отрицательный внешний вид RegEx