Может быть полезен некоторый вариант diff, например, wdiff
Если вы решите разработать собственный алгоритм, вам придется обратиться к ситуации, когда предложение быловставлено.Например, для следующих двух документов:
The men are bad. I hate the men
и
The men are bad. John likes the men. I hate the men
Ваш инструмент должен иметь возможность смотреть в будущее, чтобы распознать, чтово втором случае I hate the men
не был заменен на John likes the men
, но вместо этого не тронут, и перед ним вставлено новое предложение.то есть он должен сообщать о вставке предложения, а не об изменении четырех слов, за которым следует новое предложение.