Как измерить процентную разницу в кодовой базе? - PullRequest
2 голосов
/ 30 мая 2009

Задача под рукой - у меня есть три версии некоторого кода, разработанного разными кодерами, один «родительский» и два «дочерних», и мне нужно вычислить, какая из них ближе к родительской.

Размер имеющегося кода запрещает ручной подсчет различий, и мне не удалось увидеть статистику общего сходства в популярных инструментах сравнения, которые я пробовал.

Хао выстрелил паутине ^ H ^ H ^ H ^ H ^ H ^ H ^ H, получив однозначное число «сходство»?

Спасибо.

Ответы [ 2 ]

3 голосов
/ 30 мая 2009

Вы можете посчитать строки различий. В Linux вы бы сделали:

diff -r parent child1 | wc -l

diff -r parent child2 | wc -l

Таким образом, вы получаете грубую разницу в строках кода.

1 голос
/ 30 мая 2009

Возможно, вы можете использовать инструмент детектора копирования-вставки, например http://pmd.sourceforge.net/cpd.html. Я не использовал его лично, но, похоже, он может генерировать статистику.

...