Как правило, вы не можете правильно анализировать текст на английском языке с помощью регулярных выражений.
Лучшее, что вы можете сделать, - это найти пунктуацию, которая обычно завершает предложение, но, к сожалению, это не гарантия. Например текст г-н. Блоггс здесь. Вы хотите поговорить с ним? содержит два периода, которые имеют разные значения. Регулярное выражение не может различить два использования периода.
Я бы предложил вместо этого взглянуть на библиотеку синтаксического анализа на естественном языке. Например, Stanford Parser не имеет никаких проблем с правильным синтаксическим анализом вышеприведенного текста в два предложения:
Mr./NNP Bloggs/NNP is/VBZ here/RB <b>./.</b>
Do/VBP you/PRP want/VB to/TO talk/VB to/TO him/PRP <b>?/.</b>
Существует множество других свободно доступных библиотек NLP, которые вы также можете использовать, я не одобряю этот конкретный продукт в отдельности - это всего лишь пример, демонстрирующий, что можно разбивать текст на предложения с довольно высокой надежностью. Однако обратите внимание, что даже библиотека синтаксического анализа на естественном языке все еще иногда допускает ошибку - правильно анализировать человеческие языки сложно.