Я пытаюсь переделать работу «Сравнение схожести двоичного кода с помощью нейронного машинного перевода вне функциональной пары», но мне не удалось завершить некоторые компоненты.
Автор сказал: « Мы изменяембэкэнды для добавления аннотатора границ базового блока, который не только четко маркирует границы блоков, но также аннотирует уникальный идентификатор для каждого сгенерированного сборочного блока таким образом, что все сборочные блоки скомпилированы из одного и того же блока IR '.
Я не знаю, как пометить границы блока, чтобы определить, исходят ли несколько кодов сборки для разных архитектур из одного и того же исходного кода с помощью LLVM или других инструментов.
Я ценю любую помощь.