Я пытаюсь сделать сравнение некоторых алгоритмов для плагиата.Я нашел много текстовых сравнений на плагиат.
Но в алгоритме все по-другому.Скажем, в каком-то алгоритме используется огромное количество переменных, функций и пользовательских структур.Если кто-то скопирует исходный код у кого-то, он, по крайней мере, изменит имена переменных и функций.С помощью простого алгоритма сравнения текста это различие в функциях и буквах переменных будет считаться «различием», что делает алгоритм «ложным» для плагиата.
Что я хочу сделать, это «обобщить» (Я не знаю, правильное ли это слово) имена всех переменных, функций и пользовательских структур в исходном коде C ++.Таким образом, переменные будут именоваться как «a», «b», то же самое для функций «... fa (...)», «... fb (...)».У меня есть исходные алгоритмы c ++ в строковых переменных в PHP для сравнения.
Я знаю, что для точного сравнения исходного кода нужно проанализировать много других вещей, но этого мне будет достаточно.