У меня была похожая проблема, и после того, как я понял, что шаблон регулярного выражения будет проверять только теги, я изменил тег на интересующем вас фрагменте.
Например, я пытался сопоставить название продукта иверсия и использование правила чанка, такого как \ NNP + \ CD, работали для «Internet Explorer 8.0», но не работали в «Internet Explorer 8.0 SP2», где он помечал SP2 как NNP.
Возможно, я мог бы обучить POS-тегер, но решил вместо этого просто изменить тег на SP, и тогда правило чанков, такое как \ NNP + \ CD \ SP *, будет соответствовать любому примеру.