Я пытался разбить документы на предложения, но есть некоторые странные результаты из-за пунктуации...
По какой-то причине буква 'n' регистрируется как пунктуация с помощью grep. test="n"...