Это невозможно с регулярным выражением. Невозможно отличить слова, содержащие знаки препинания («J.» в вашем примере или «младший» - это слово, которое не является единичным символом), где вы хотите, чтобы знаки препинания были частью токена, от слов, за которыми следовала пунктуация («предложение»). . "в вашем примере), где вы хотите использовать пунктуацию в качестве собственного токена.
Вам понадобится библиотека синтаксического анализа на естественном языке, чтобы заставить ее работать, так как вы описали проблему.
Может можно разработать некоторую эвристику, такую как длина слова и следовать ли за ней слово с заглавной буквой, или общие слова из белого списка, которые нарушают правила, но у вас будут проблемы, делающие эту работу надежной.