При использовании Google diff_match_patch для получения различий в этих двух предложениях я получаю результат, который не соответствует действительности, указывает на разницу в моем мнении.
Предложение 1:
"Есть 785 кгводы. "
Предложение 2:
" Есть 800 кг воды. "
Когда я запускаю это с любым из методов очистки, они все обрабатывают каждое отдельное числокак изменение.псевдо-вывод:
"There are <old>7</old>8<old>5</old><new>00</new>kg of water."
Я хотел бы, чтобы вывод обрабатывал «785 кг» как слово и «800 кг» как слово.Или в худшем случае трактуйте «785» как слово и «800» как слово.В моем случае вывод будет выглядеть следующим образом:
"There are <old>785kg</old><new>800kg</new> of water."
или в худшем случае это:
"There are <old>785</old><new>800</new>kg of water."