Извините, если это не по теме, но у вас есть шанс уменьшить количество «домашних заданий» на этом сайте: -)
Я преподаю класс программирования C, на котором работают студентыв небольшой библиотеке числовых подпрограмм на C. В этом году исходные файлы нескольких групп учащихся содержали значительное количество дублирующегося кода.
(вплоть до идентично написанных с ошибками printf
операторов отладки. Я имею в виду,насколько вы можете быть глупы.)
Я знаю, что Git может обнаружить, когда два исходных файла похожи друг на друга за определенный порог, но я никогда не смог заставить это работать на двух исходных файлах, которые не находятся вGit репозиторий.
Имейте в виду, что это не особенно искушенные ученики.Маловероятно, что они столкнутся с проблемой изменения имен переменных / функций.
Есть ли способ, с помощью которого я могу использовать Git для обнаружения значительного и буквального дублирования кода, известного как плагиат?Или есть какой-то другой инструмент, который вы могли бы порекомендовать для этого