Я анализирую устаревший код. Это около 80.000 строк старого кода plsql. На первый взгляд, в источнике есть некоторое дублирование, которое нужно удалить. Вместо того, чтобы выполнять руководство diff и просматривать каждый файл, должен быть какой-то инструмент / командная строка, сконфигурированная для обнаружения дублирующих строк исходного кода.
Моя цель состоит в том, чтобы сделать обоснованное предположение о минимальном размере переписанного источника и о том, сколько фактических знаний содержится в этой программе. Я написал несколько базовых статических анализаторов кода, чтобы найти количество управляющих операторов IF ELSE FOR и т. Д. И функций в каждом файле.
Но дублированный код все еще должен быть удален из моей статистики.