DiffMatchPatch обрабатывает числа как слова - PullRequest
0 голосов
/ 21 сентября 2018

При использовании Google diff_match_patch для получения различий в этих двух предложениях я получаю результат, который не соответствует действительности, указывает на разницу в моем мнении.

Предложение 1:

"Есть 785 кгводы. "

Предложение 2:

" Есть 800 кг воды. "

Когда я запускаю это с любым из методов очистки, они все обрабатывают каждое отдельное числокак изменение.псевдо-вывод:

 "There are <old>7</old>8<old>5</old><new>00</new>kg of water."

Я хотел бы, чтобы вывод обрабатывал «785 кг» как слово и «800 кг» как слово.Или в худшем случае трактуйте «785» как слово и «800» как слово.В моем случае вывод будет выглядеть следующим образом:

 "There are <old>785kg</old><new>800kg</new> of water."

или в худшем случае это:

 "There are <old>785</old><new>800</new>kg of water."
...